Le mie informazioni di contatto
Posta[email protected]
2024-08-15
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Rispetto a Robotaxi, oggi è più importante la stabilità del sistema di co-guida uomo-veicolo.
Testo |.Wang Hailu
C’è sempre stata una disputa tra due percorsi nel settore della guida autonoma. Società di guida autonoma rappresentate da Google Waymo eTeslaLe case automobilistiche rappresentate dall'azienda salivano dai versanti sud e nord della stessa montagna. La cima della montagna è senza conducente e lo scenario commerciale più attraente è Robotaxi (taxi a guida autonoma).
Sebbene sia le vendite che il prezzo delle azioni mostrino che Tesla sta scalando la montagna più velocemente. Ma quando il fondatore Musk propose che Tesla Robotaxi sarebbe stato lanciato nell’ottobre di quest’anno, suscitò ancora molte polemiche.
Hou Cong, cofondatore e presidente di Qingzhou Zhihang, è uno dei dubbiosi. "Non l'ho mai capito del tutto. La storia di Robotaxi è stata raccontata per così tanti anni e non è mai stata realizzata. Perché la gente vuole ancora credere in Musk?", ha detto Hou Cong.
Sebbene il sistema di guida intelligente FSD V12 di Tesla basato sulla tecnologia end-to-end funzioni in modo superiore, Hou Cong ritiene che sia ancora lontano da un vero Robotaxi. Ha citato casualmente un problema che il sistema non riusciva a gestire: "Cosa devo fare se l'auto è bloccata in mezzo alla strada? Chiedi al proprietario dell'auto di prendere un taxi e liberare l'auto?"
Le strade urbane sono complesse, persone e veicoli si mescolano e ci sono molti scenari di gioco che l'intelligenza artificiale di oggi non è in grado di gestire. La flotta di Robotaxi pesantemente armata di Waymo non è riuscita a uscire dall'area di dimostrazione. Hou Cong ritiene che sia impossibile per Tesla soddisfare i requisiti dei Robotaxi facendo affidamento solo sulle telecamere.
I quattro cofondatori di Qingzhou Zhihang provengono tutti da Waymo. Hou Cong è entrato in Google non appena si è laureato, lavorando prima su un compilatore, e poi trasferito al team di progetto dei veicoli autonomi del laboratorio Google X per lavorare sul sistema di percezione.
Anche Yu Qian, co-fondatore e CEO di Qingzhou Zhihang, faceva parte del gruppo di percezione in quel momento ed era un collega nello stesso dipartimento di Hou Cong. I due sono anche ex studenti dell'Università Tsinghua.
Hou Cong si è laureato in automazione e si è trasferito al dipartimento di computer come studente laureato. Ma prima di potermi laureare, andai al Georgia Institute of Technology negli Stati Uniti per studiare per un dottorato. Ha descritto se stesso come uno che aveva poco interesse per la ricerca accademica pura e più desiderio per la pratica dell'ingegneria tecnica, quindi è andato su Google dopo aver conseguito il dottorato.
Nel 2016, Google ha scorporato il suo team di progetto per le auto a guida autonoma e ha fondato Waymo, che è direttamente controllata dalla società madre di Google, Alphabet. Hou Cong e Yu Qian divennero i primi ingegneri di Waymo.
Hou Cong è responsabile dell'ottimizzazione delle prestazioni e ha molti contatti con vari dipartimenti, quindi ha conosciuto Dafang e Wang Kun, che all'epoca stavano facendo pianificazione e simulazione presso Waymo. Nel 2019, quattro ingegneri cinesi hanno co-fondato Qingzhou Zhihang.
Non era più il momento più caldo per il settore della guida autonoma. La società cinese di guida autonoma Pony.ai è stata fondata da 3 anni e Tucson da 5 anni. Le aziende di guida autonoma che utilizzano Robotaxi o camion pesanti senza pilota come scenari di atterraggio hanno già sottratto la maggior parte dei fondi sul mercato. Qingzhou ha scelto un percorso con meno concorrenti e meno capitali: minibus senza pilota.
Hou Cong ha detto che non aveva realizzato Robotaxi in quel momento perché pensava che Robotaxi sarebbe stato implementato troppo lentamente. Waymo ha iniziato a gestire una flotta di Robotaxi a Phoenix, in Arizona, nel 2016, e fino ad oggi sembra essere bloccata in innumerevoli casi d'angolo.
I costi della manodopera interna sono bassi e le strade sono più complesse, il che rende più difficile la realizzazione di Robotaxi. Hou Cong è andato a provare la corsa delle carote di Baidu nel giugno di quest'anno e la sua esperienza è stata nella media. Ha detto senza mezzi termini: "L'attuale situazione di Carrot Run è impossibile per Waymo operare in questo stato".
Qingzhou sta costruendo un minibus senza conducente All’inizio pensavo che questo scenario sarebbe stato più facile da implementare rispetto a Robotaxi. Tuttavia, dopo aver condotto operazioni pilota in 10 città tra cui Suzhou, Pechino e Wuhan, hanno scoperto di aver semplificato eccessivamente il problema. È difficile guadagnare con gli autobus e le normative sono state lente ad essere implementate.
All'inizio, Qingzhou faceva affidamento sul background e sull'accumulo di tecnologia del team fondatore per ottenere con successo investimenti da capitali di primo livello come IDG, Lenovo Ventures, Meituan Longzhu Capital e Yunfeng Fund. Ma nel 2021, gli investitori hanno iniziato a prestare attenzione alle capacità ematopoietiche e il percorso di finanziamento per le società di guida autonoma L4 è diventato sempre più difficile.
In netto contrasto, il prezzo delle azioni Tesla è salito ancora una volta alle stelle nel 2021. Il tasso di penetrazione dei veicoli a nuova energia in Cina sta aumentando rapidamente e le funzioni di guida intelligente sono diventate caratteristiche standard dei veicoli elettrici. A metà di quell’anno, Qingzhou cambiò direzione e si trasformò da L4 a L2+ per fornire soluzioni di guida intelligenti per veicoli elettrici.
Nell'agosto dello stesso anno, Tesla presentò per la prima volta il BEV (Bird'sEyeView, vista a volo d'uccello) all'AI DAY.
) e il modello Transformer combinano le informazioni sulla percezione provenienti da diverse angolazioni della telecamera in un'immagine dall'alto verso il basso, rendendo più semplice per il sistema comprendere e prevedere le condizioni stradali. Le aziende nazionali produttrici di veicoli elettrici intelligenti hanno seguito l’esempio e riscritto gli algoritmi di rilevamento. Qingzhou si è radicalmente trasformata in questo momento ed è diventata uno dei primi fornitori di guida intelligente in Cina a produrre BEV.
Questo sistema è implementato sul chip Horizon J5. Il CTO di Horizon Huang Chang, Hou Cong e Yu Qian sono ex studenti di Tsinghua e Yu Qian è un membro senior della University of Southern California. A causa di questa origine e riconoscimento di tecnologia e concetti, Orizzonte 2022 ha cercato la cooperazione con partner ecologici e si è accordato con Qingzhou.
Alla fine del 2022, Qingzhou ha lanciato una soluzione di test NOA (sistema di guida assistita alla navigazione) urbana e ad alta velocità basata sul chip Horizon J5. Successivamente, Horizon ha consigliato Qingzhoumacchina ideale。
Ideal ha iniziato a sviluppare il proprio sistema di guida intelligente utilizzando i chip Horizon nel 2021 e successivamente ha pianificato due soluzioni di sistema, AD Max e AD Pro, basate sui chip NVIDIA OrinX e Horizon J5.
Nella seconda metà del 2023, Ideal ha deciso di concentrare le proprie risorse interne di ricerca e sviluppo su AD Max e di consegnare il sistema AD Pro a un fornitore per la manutenzione e gli aggiornamenti. Qingzhou ha colto questa opportunità.
Dopo che Qingzhou è subentrata, ha collaborato con il team Ideal per ottimizzare il sistema e ha presentato agli utenti una versione del sistema basata sull'architettura dell'algoritmo di Qingzhou nel maggio di quest'anno.
Hou Cong ha finalmente ottenuto ciò che voleva, ovvero praticare l'ingegneria e fornire agli utenti i prodotti che aveva sviluppato. Allo stesso tempo, sentiva profondamente anche la grande responsabilità.
A partire da maggio di quest'anno, il modello Lili AD Pro conta 400.000 proprietari. Più persone utilizzano un sistema e quanto più frequentemente viene utilizzato, maggiori saranno i problemi esposti. Ma più persone lo usano e maggiore è la frequenza di utilizzo, significa semplicemente che il prodotto è migliore.
Rispetto alla realizzazione della guida senza conducente e alla costruzione di Robotaxi in precedenza, mantenere la stabilità del sistema di guida assistita in cui una persona e un’auto guidano insieme e garantire la sicurezza di guida di centinaia di migliaia di utenti sono sfide che Qingzhou è più disposta ad affrontare oggi.
Quella che segue è una conversazione tra Insight e il CTO Hou Cong di Qingzhou Zhihang (modificata):
Quattro ingegneri Waymo avviano un'impresa
Insight: i vostri quattro co-fondatori erano tutti ingegneri Waymo. Perché vi siete riuniti per avviare un'impresa?
Hou Cong:All'inizio, Yu Qian (co-fondatore e CEO di Qingzhou) mi ha contattato e abbiamo pensato di poterlo fare. A quel tempo, Waymo non aveva molti cinesi, quindi abbiamo trovato alcune persone che pensavamo fossero esperte e capaci.
A quel tempo, mi occupavo di ottimizzazione delle prestazioni e progettazione dell'architettura presso Waymo, facevo parte dello stesso team di Yu Qian e avevo una collaborazione commerciale con tutti e tre.
Insight: come dividi il lavoro e decidi chi fa cosa?
Hou Cong:La direzione di noi quattro è particolarmente casuale. Sia io che Yu Qian ci occupiamo della percezione, ma io il sistema e lui l'algoritmo. Dafang (capo scienziato) si occupa della pianificazione e Wang Kun (COO) si occupa della simulazione. Sono quattro direzioni diverse.
Yu Qian e Dafang sono più simili a scienziati. Il mio interesse è per l'ingegneria, il che significa mettere in pratica la tecnologia, concentrandomi sulla pratica e sui prodotti. Quindi sono andato all'industria non appena mi sono laureato.
Yunjian Insight: Presenta brevemente la tua prima esperienza?
Hou Cong:La mia laurea era presso il Dipartimento di Automazione dell'Università di Tsinghua. Dopo la laurea, sono andato al Dipartimento di Informatica per studiare per una laurea. Ho lavorato nel campo della visione per più di un anno, ma ho abbandonato gli studi prima di finire gli studi. Sono andato negli Stati Uniti per studiare per un dottorato di ricerca. Dopo la laurea nel 2013, sono andato su Google.
Quando sono andato su Google per la prima volta, ho lavorato come compilatore. Dopo aver lavorato lì per un anno, sono stato prestato al team delle infrastrutture per lavorare sulle GPU. Forse è stato perché in quel momento ho apportato alcune ottimizzazioni alla CPU, cosa che è stata riconosciuta da Jeff Dean (capo scienziato di Google) e successivamente consigliata al gruppo GPU.
Quel gruppo in seguito si è sviluppato molto bene, lavorando su alcuni compilatori per TPU, oltre allo sviluppo di alcune librerie sottostanti sotto Google Brain (l'architettura di Google per l'addestramento delle reti neurali) e XLA (il compilatore di deep learning di Google) è stato ciò che hanno fatto.
Successivamente il lavoro sulla GPU si è concluso e il laboratorio di Google X ci ha dato l'opportunità di ottimizzare il sistema di percezione dei veicoli autonomi. A quel tempo esisteva un progetto chiamato "20%", che significava dedicare il 20% del proprio tempo a un progetto.
Fu Zhu Jiajun a chiamarmi in quel momento. Successivamente fonda la Nuro (società di guida autonoma). Lavoro nel gruppo di percezione da più di tre anni.
Insight: Com'è lavorare in Waymo?
Hou Cong:Più come Google. Era di proprietà di Google X prima di diventare indipendente nel 2017. Google produce principalmente software e Google X produce hardware. In ufficio ci sono tutti i tipi di cose strane, inclusi bracci robotici, torni e molte attrezzature.
Il lavoro svolto lì è simile a quello di Google, dove tutti enfatizzano la guida autonoma, la cooperazione e sono guidati dagli OKR. Si crea un buon ambiente culturale, dove tutti sperano di fare meglio, e qualcuno progetterà il sistema di performance in modo che le persone con forti capacità possano emergere dalla competizione. È vero che la soglia è relativamente alta e molte persone di Google potrebbero non riuscire ad accedervi.
Yunjian Insight: gli ingegneri di Waymo?
Hou Cong:Più vai indietro, più si arriccia. Il periodo più impegnativo è stato probabilmente i due anni successivi alla nostra partenza. Erano molto sotto pressione perché facessero quello che dovevano fare a San Francisco. Quando eravamo qui nessuno ti obbligava, ma per me era normale fare gli straordinari di notte e a mezzogiorno. A volte tutti inviavano e-mail per fare domande nel cuore della notte.
Yunjian Insight: A che ora è il tempo libero?
Hou Cong:Non ci sono regole.
Yunjian Insight: Posso smettere di lavorare alle 15:30?
Hou Cong:Potere. Sono una di quelle persone che arriva tardi e se ne va tardi. Di solito ci vado dopo le 22, ceno e lavoro un po' prima di partire, praticamente dalle 10 alle 9.
Approfondimento: gli ingegneri cinesi sono le persone che lavorano più duramente in Waymo?
Hou Cong:Nel complesso, sono decisamente più laboriosi, ma in realtà anche gli americani sono grandi lavoratori. Crea il tipo di ambiente culturale in cui tutti si sentono a proprio agio nel fare le cose. Non devono preoccuparsi di molte cose complicate e devono solo concentrarsi sul fare bene il proprio lavoro.
Penso che l'efficienza del lavoro sia piuttosto elevata. Alcuni team svilupperanno persone pigre dopo molto tempo, ma Waymo si stava sviluppando in modo relativamente rapido in quel momento, quindi non avevo previsto che ciò accadesse.
Yunjian Insight: È stato OpenAI, non Google, a rendere popolari i modelli di grandi dimensioni. Quale pensi sia il motivo?
Hou Cong:Ci sono alcune politiche interne nelle grandi aziende e spesso prendono decisioni con esitazione e talvolta non osano rischiare. Penso che ogni volta che Google fa qualcosa, è particolarmente preoccupato per il rischio dell'opinione pubblica, e talvolta è piuttosto conservatore.
Insight: ti senti molto a tuo agio a lavorare in Waymo. Hai lasciato Waymo nel 2019 per avviare un'impresa. Qual è stata la forza trainante principale?
Hou Cong:A volte non è bello sentirsi troppo a proprio agio e penserai a molti problemi della vita. Puoi vedere come saranno i prossimi 10 o 20 anni. Sicuramente non mancano i soldi nella Silicon Valley e puoi comprare una buona casa. Allora cosa cerchi? C'è infatti un limite alla carriera. A causa dell'ambiente culturale e linguistico, è difficile per te partecipare al livello decisionale dell'azienda. Sicuramente non è come in Cina. Se vuoi fare grandi cose, in America sei più un giocatore che un decisore.
La mia macchina è bloccata all'incrocio, chi mi soccorrerà?
Insight: Quando eri a Waymo, Waymo aveva già avviato l'operazione di prova di Robotaxi dove era bloccato in quel momento?
Hou Cong:È bloccato su alcune custodie d'angolo. È andato a Phoenix nel 2016. Mi è capitato di essere lì in quel periodo. C’erano meno persone e macchine lì, le strade erano larghe, il tempo era bello e non pioveva spesso. Ma anche la domanda è bassa. Phoenix non può regolare i conti. È un sito operativo di prova, non un sito commerciale. Quindi, nel 2018, Waymo ha spostato completamente la sua attenzione su San Francisco.
Un sistema che all'epoca funzionava bene a Phoenix fu completamente rovinato a San Francisco. Il tasso di acquisizione era estremamente alto e non poteva essere gestito affatto. A quel tempo esisteva ancora un limite tecnico. Ovviamente aveva a che fare con la distribuzione dei dati. Non raccoglievamo molti dati a San Francisco. San Francisco ha pendii molto ripidi, spesso compresi tra 30 e 40 gradi. Comprese le sue regole del traffico (diverse), persone e veicoli interagiscono frequentemente, quindi il problema di Waymo in quel momento era quello di affrontare alcuni casi limite.
Waymo è molto cauto e non oserà aprire finché non sarà molto sicuro. Ma data la situazione attuale di Carrot Kuaishou, e ho anche viaggiato con le loro auto, è impossibile per Waymo operare in questo stato.
Yunjian Insight: Quando hai provato la Corsa delle carote di Baidu, quali problemi hai riscontrato?
Hou Cong:Sono andato a giugno. C'è un problema con la sensazione corporea e un senso di frustrazione. Waymo è davvero migliore della guida umana. È molto comodo frenare, avviare e girare. È l'esperienza di un automobilista di portineria.
In secondo luogo, Carrot Run è estremamente conservatore. Ad esempio, quando si effettua un'inversione a U, i dossi sono particolarmente forti e si viene costantemente disturbati dalle auto circostanti. C'era un altro posto dove dietro era rimasto bloccato un camion da lavoro, che continuava a seguirlo lentamente senza girargli intorno.
A giudicare dalla configurazione base del sensore, non si tratta di una soluzione L4 molto seria. Waymo è armato fino ai denti, dotato di 5 lidar, 30 telecamere e radar a onde millimetriche. Carrot Run sicuramente non ha fatto questo. Ciò è legato anche alla situazione cinese, in cui il costo del lavoro è troppo basso e il paese sarà ben lontano dal raggiungere rendimenti commerciali.
Le aziende nazionali potrebbero essere costrette ad adottare soluzioni a basso costo. Tuttavia, il basso costo farà sì che il tuo limite tecnico sia inferiore rispetto ad altri, rendendo più difficile la risoluzione dei casi limite.
La Cina si trova di fronte a un dilemma L4, con persone a basso costo e un ambiente complicato. I partecipanti al traffico hanno una scarsa prevedibilità e un gran numero di campi di gioco. La progettazione stradale non è così standardizzata.
La costruzione domestica non è così standardizzata. L'auto di Meituan è caduta in una fossa prima, hai incolpato Meituan? Se la squadra di costruzione non avesse messo il cono, la gente potrebbe vedere una fossa davanti ad esso, ma l'auto di Meituan non si aspetterebbe che ci fosse una fossa. Ma negli Stati Uniti, se qualcuno cade, deve fare causa al governo o all’unità sociale. Questo meccanismo sicuramente non è il caso in Cina. Penso che la Cina sarà molto indietro nello sviluppo di L4 rispetto agli Stati Uniti.
Yunjian Insight: cosa ne pensi del Robotaxi di Tesla?
Hou Cong:Poi non lo riconosco. Penso che sia possibile lanciare un modello, ad esempio, senza volante o con alcune configurazioni aggiuntive rispetto all'attuale versione utente dell'auto. Ma il suo attuale stack tecnologico non è orientato alla L4. Una volta che inizi a utilizzare un Robotaxi, sorgeranno molti problemi.
L4 è naturalmente correlato alle operazioni. Può anche risolvere alcuni problemi tecnici tramite le operazioni. Tesla non dispone di tale sistema operativo.
Yunjian Insight: Lo scenario previsto da Tesla è che i proprietari di auto possano prendere un Uber quando la loro auto è ferma.
Hou Cong:Cosa devo fare se la mia macchina è bloccata in mezzo alla strada? Chi salverà questa macchina? Lasciare che il proprietario dell'auto prenda un taxi e salvi l'auto? Queste sono questioni molto pratiche.
L'auto si bloccherà sicuramente e, se lo fai spesso, ci saranno sicuramente alcune scene. O sei troppo cauto, oppure non sai come interagire con le persone, o addirittura rimani bloccato tra le auto.
Ad esempio, se due Tesla Robotaxi si mordessero a vicenda, questo problema sarà difficile da risolvere. Quando non c'è il semaforo rosso a un incrocio, tutte le auto cercano di occupare l'incrocio e alla fine rimangono bloccate l'una con l'altra, incapaci di muoversi.
In effetti non l'ho mai capito del tutto. La storia di Robotaxi è stata raccontata per così tanti anni e non è mai stata realizzata. Perché tutti sono ancora disposti a credere a Musk? Ammiro moltissimo Musk e penso che faccia molto bene anche altre cose. Ma si vantava un po' di Robotaxi e sottovalutava la difficoltà della questione.
Yunjian Insight: Fino a che punto pensi che l'effetto di Tesla FSD V12 sia rispetto al Robotaxi di livello L4?
Hou Cong:Nemmeno vicino. Faccio un esempio al contrario. Perché Waymo ha progettato la sua auto in quel modo? Ha diversi tipi di telecamere, una è una normale telecamera; una è per l'uso notturno e ha forti capacità di visione notturna; una è per le luci a LED; c'è l'imaging termico; e c'è una telecamera per gli angoli ciechi con flash a infrarossi. Ha fotocamere di categoria cinque.
Tesla ha solo un tipo di fotocamera. Pensi che Waymo sia stupido? Non è stupido. Dopo aver visto troppi casi angolari, non ha altra scelta che risolvere questo problema tramite l'hardware. Devi sfondare il software, non è molto facile da usare. Soprattutto negli Stati Uniti di notte è molto buio e in molti posti non ci sono lampioni.
Se Tesla va in viaggio con la sua attuale configurazione, inclusa Carrot Run, un professionista che è professionale nel commettere errori avrà molti modi per commettere errori perché il suo hardware ha troppi difetti.
Approfondimento: hai sperimentato la FSD V12 negli Stati Uniti?
Hou Cong:L'ho sperimentato quando sono andato lì a marzo di quest'anno, e di nuovo a maggio, ed era aperto tutti i giorni.
Ad essere onesti, non penso che il V12 sia straordinario, penso solo che la sua praticità sia migliorata. In città, soprattutto agli incroci, il comportamento è cambiato sensibilmente rispetto al V11. Per lo più buono, ma non perfetto.
La Tesla V11 fa già un ottimo lavoro in autostrada. Gli incroci in città sono molto conservatori e disumani, il che lo rende imbarazzante. Ci sono un sacco di macchine dietro di te, quindi vai avanti lentamente. Dopo averlo guardato a lungo, si muoveva molto lentamente. Poiché ha dei punti ciechi, questo comportamento non è come quello degli esseri umani. Inoltre, quando si gira, il volante girerà improvvisamente, provocando il panico.
Yunjian Insight: L’attuale soluzione tecnica end-to-end di Tesla deve continuare a risolvere anche casi limite?
Hou Cong:Il caso d'angolo deve essere risolto. End-to-end integra le informazioni provenienti da diversi moduli principali degli algoritmi tradizionali e utilizza queste informazioni per ottenere un risultato migliore.
Il limite superiore dell'end-to-end è elevato e il limite inferiore è inferiore all'inizio perché ha una scarsa controllabilità. In passato il sistema era suddiviso in moduli e ciascun modulo definiva un'interfaccia. Segui gli standard e non apparirà nulla di strano. Fondamentalmente, l'utilizzo delle regole può risolvere una serie di problemi contemporaneamente.
Non esiste un concetto del genere end-to-end. Possiamo solo utilizzare dati più diversificati per risolvere il problema del limite inferiore. Ho visto abbastanza situazioni come questa e finalmente so come risolverle.
Yunjian Insight: Il modello end-to-end equivale a una scatola nera Se si verifica un problema, come trovarlo e risolverlo?
Hou Cong:Non deve essere una cosiddetta scatola nera. Se si estrapolano dai risultati i suoi output, i risultati della percezione e della pianificazione sono tutti lì, quindi deve sfruttare appieno la sua esperienza precedente per formare un nuovo modello. Questo modello ha un certo grado di controllabilità, ad esempio, questa parte è la percezione, quella parte è la previsione e quella parte è la pianificazione, ma deve comunque distinguere le diverse fasi.
Insight: quando prevedi che FSD verrà lanciato in Cina?
Hou Cong:l'anno prossimo. Avrebbe dovuto essere fatto per quasi un anno. Non sono sicuro dei dettagli, ma sta iniziando a reclutare ingegneri di algoritmi, il che significa che è iniziato. Non dice che 10 miliardi di dollari saranno spesi a livello nazionale? Costruisci varie strutture.
Approfondimento: cosa è necessario fare affinché la FSD venga implementata in Cina?
Hou Cong:Costruisci un data center e adatta i suoi algoritmi a livello nazionale. Perché dopotutto la scena domestica è complicata. Speriamo soprattutto che FSD arrivi in Cina, perché è un punto di riferimento e, se investe di più, dovrebbe essere il più veloce.
Yunjian Insight: le case automobilistiche nazionali hanno qualche strategia di risposta?
Hou Cong:Tutto quello che possiamo fare è inseguire. Dopotutto, penso che i giocatori nazionali abbiano alcuni vantaggi nell'installare lidar. L'aggiunta di lidar renderà sicuramente questo problema più semplice.
Yunjian Insight: È possibile che il Robotaxi di Tesla non avrà i sensori attuali, ma sarà dotato di lidar o di telecamere ad alta definizione?
Hou Cong:Giusto. Ciò ridurrebbe sicuramente la difficoltà, ma potrebbe non essere coerente con il suo concetto.
Tesla ora può solo sperare nel continuo sviluppo dell’intelligenza artificiale (intelligenza artificiale). Penso che questa possibilità esista, ma le persone devono risolvere diversi tipi di problemi durante la guida. Stai interagendo con il mondo reale e non stai mettendo alla prova la tua abilità di guida, ma alcune cose istintive.
In secondo luogo, durante la guida, le persone controlleranno l’ambiente dell’auto e giudicheranno le possibilità attraverso la propria comprensione dell’ambiente circostante. Ad esempio, se trovi un cane, questo scompare man mano che avanzi. A questo punto, potresti scendere dall'auto e controllare se il cane è davanti. In una scena come questa, la percezione umana si espande in un istante. Se l’auto non ha un design rilevante, in realtà è più pericolosa.
Yunjian Insight: Pensi che Tesla possa realizzare Robotaxi se si affida esclusivamente alle capacità del software?
Hou Cong:Questo è molto impegnativo e i requisiti per l’intelligenza artificiale sono molto elevati. Penso che a lungo termine si possa sicuramente realizzare, ma il processo non è quello che immaginavo. L'intelligenza artificiale esiste da decenni ed è stata mostrata in un gran numero di film di fantascienza, ma fino ad ora non è stata veramente risolta. A volte puoi facilmente pensarla in modo troppo semplice.
Yunjian Insight: Tesla prevede di espandere il cluster di potenza di calcolo Dojo a 100 EFLOPS (unità di potenza di calcolo) nell'ottobre di quest'anno. La differenza tra le altre case automobilistiche e Tesla è di ordini di grandezza. Cosa ne pensi del divario?
Hou Cong:Questa è una cosa di investimento pesante. Tesla aveva margini di profitto molto elevati. Vende così tante auto in tutto il mondo che è conveniente e anche il prezzo delle sue azioni ha un supporto relativamente forte. I produttori di automobili nazionali sono così grandi che è impossibile investire una quantità così grande di risorse. Questo è il motivo per cui gli Stati Uniti hanno realizzato prima il grande modello, ma non la Cina? Implica molti investimenti e ci vogliono molti anni per bruciare denaro e la logica di investimento dietro è diversa.
Yunjian Insight: Attualmente riservate la potenza di calcolo per le operazioni end-to-end?
Hou Cong:Lo stiamo facendo anche noi, ma in modo diverso. Se seguissimo l'approccio di Tesla e costassimo decine di migliaia di dollari per l'A100, ovviamente non possiamo permettercelo. Alcune migliaia di dollari sarebbero un peso enorme. Apporteremo alcune restrizioni in base ai nostri prodotti, quindi l'investimento sarà molto inferiore.
Insight: Se gli investitori ti danno abbastanza soldi, quale strada sceglierai?
Hou Cong:Se ci saranno abbastanza soldi andremo in questa direzione. Ma non ci sono se. Tutti conoscono la situazione attuale e il mercato è così.
Dai minibus senza conducente alla guida assistita
Yunjian Insight: Quando hai iniziato, la guida autonoma non era più così popolare nel mercato dei capitali. Hai incontrato difficoltà con i finanziamenti?
Hou Cong:Sicuramente non è così facile come lo era all’inizio. I finanziamenti nella fase iniziale ammontavano solitamente a diverse centinaia di milioni, ma quando si trattava di noi, era molto più difficile. Tuttavia, penso che questa sia una buona cosa per la nostra transizione a L2. Se raccogli molti soldi nella fase iniziale, sarà difficile passare a L2. La tua valutazione verrà lasciata qui.
Yunjian Insight: A quel tempo, molte persone stavano già avviando attività nel campo della guida autonoma. Perché pensi che ci sia ancora una possibilità?
Hou Cong:Tecnicamente parlando, riteniamo di essere un po’ avanzati. Conosciamo L4 meglio di altri. In secondo luogo, L4 ha la possibilità di essere implementato in molti scenari, non solo robotaxi e camion pesanti. A quel tempo, se volevi raccogliere molti soldi, potevi costruire un camion pesante o un robotaxi. Ma pensiamo che ci siano opportunità in altre direzioni. Questo tipo di veicoli a media e bassa velocità, siano essi minibus, distribuzione logistica, veicoli operativi, veicoli igienico-sanitari, veicoli di vendita o applicazioni in alcuni ambienti chiusi, come terminali minerari o alcune fabbriche, sebbene il mercato sia relativamente piccolo, riteniamo che la sua commercializzazione è ancora relativamente piccola Quello (Robotaxi) è più veloce e ha requisiti tecnici inferiori.
Yunjian Insight: Perché hai costruito un minibus senza conducente quando hai avviato la tua attività?
Hou Cong:Perché la difficoltà è bassa. Lo scenario immaginato allora era una microcircolazione, ovvero uno scenario relativamente fisso di veicoli a media e bassa velocità, non solo minibus, ma anche mezzi logistici e da lavoro.
Yunjian Insight: I minibus autonomi non sono mai stati commercializzati. Quale pensi sia il motivo principale?
Hou Cong:È anche una questione di modello di business e di chi paga per questo.
Yunjian Insight: Ti trasformerai nella guida assistita per autovetture nel 2021. Cosa ti ha ispirato a prendere questa decisione?
Hou Cong:Ritengo ancora che l'implementazione aziendale di L4 sia relativamente lenta, richieda ingenti investimenti, abbia un percorso lento e abbia un ciclo lungo. Se continuiamo così potremmo avere delle difficoltà finanziarie. Crediamo che dovremmo trovare alcune soluzioni che possano essere commercializzate rapidamente in modo da poter continuare ad andare avanti. L2++ Questo mercato è adatto.
La nuova energia si sta sviluppando molto rapidamente nel 2021, il prezzo delle azioni Tesla è salito di nuovo alle stelle, il tasso di penetrazione dei veicoli a nuova energia in Cina continua ad aumentare e la domanda di guida intelligente continua ad aumentare. Si dà il caso che la nostra tecnologia sia relativamente facile da applicare alle funzioni di guida assistita e possiamo commercializzarla a breve termine.
Yunjian Insight: Perché non hai voluto fare L2 il primo giorno di avvio di un’impresa?
Hou Cong:Non mi aspettavo che L2 fosse così veloce. A quel tempo, Tesla non aveva ancora lanciato una soluzione efficace. L'hardware 3.0 era appena stato lanciato in quel momento. Nel 2019, il nostro team fondatore Wang Kun ha acquistato una Tesla. Mi sono sentito troppo scioccato (dopo averlo sperimentato). Sinceramente sono uscito da Waymo con alcuni pregiudizi nei confronti delle soluzioni visive, che ritenevo inaffidabili, perché Waymo si basa principalmente su lidar.
La nostra tecnologia per realizzare i minibus, infatti, è completamente basata su Robotaxi. So che molti dei miei amici gestiscono minibus o servizi logistici a bassa velocità, che sono percorsi tecnici completamente diversi dai Robotaxi. Quindi siamo passati a L2 molto rapidamente. Alcune aziende stesse non hanno questa capacità e se insistono ad andare in questa direzione ci saranno grossi problemi con l’intera struttura.
Il minibus senza pilota di Qingzhou Zhihang
Yunjian Insight: Quando ti sei rivolto alla guida assistita per le autovetture, com'era il panorama del settore?
Hou Cong:Ci siamo trasformati dopo il primo AI Day di Tesla, quindi dobbiamo andare nella direzione del BEV. Ci siamo imposti diverse regole Prima di tutto, non costruiremo L2 di fascia bassa. È un oceano rosso e la concorrenza è già feroce. Alla fine, la competizione è ancora sui costi, che non corrisponde al nostro stack tecnologico affatto.
In quel periodo ci stavamo trasformando e discutevamo se dovessimo rifare il pianificatore. La conclusione è stata che dovremmo mantenere i nostri vantaggi e non rifarlo, perché in futuro, ciò che stiamo facendo devono essere soluzioni di fascia medio-alta e. la potenza di calcolo è garantita in una certa misura.
Insight: quali modifiche hai apportato all'algoritmo da L4 a L2?
Hou Cong:Il cambiamento nella percezione sarà più ampio, dalle soluzioni basate su nuvole di punti laser alle soluzioni basate sulla visione. Fortunatamente, abbiamo utilizzato BEV per realizzarlo subito, quindi siamo stati la prima azienda nel paese a realizzare BEV su J5.
Lavoriamo insieme sull'alta velocità e sulla NOA urbana. Pensiamo che non ci sia differenza nel sistema di percezione. L'alta velocità e la città sono integrate, ma la configurazione sarà diversa. Ad esempio, la portata di rilevamento e la potenza di calcolo saranno in qualche modo semplificate, ma l’architettura e l’algoritmo rimarranno gli stessi.
Insight: Come avete collaborato con Horizon?
Hou Cong:Abbiamo alcuni collegamenti. Yu Qian, io e il loro CTO Huang Chang veniamo tutti dall'Università Tsinghua. Ho lavorato nel Laboratorio della Visione dell'Università Tsinghua per un anno e mezzo, ed ero nello stesso laboratorio di Huang Chang. Yu Qian e Huang Chang hanno entrambi conseguito il dottorato di ricerca nel sud della California e sono compagni di studio.
All’inizio del 2022, Horizon sperava di coltivare alcuni partner ecologici e abbiamo deciso di lavorare insieme.
Yunjian Insight: Ho sentito che Yu Kai ti ha spinto verso il tuo ideale?
Hou Cong:Sì, il fratello Kai ci sostiene molto e anche noi lo sosteniamo abbastanza da aiutarli a stabilire un punto di riferimento.
Yunjian Insight: C'è un problema di potenza di calcolo della CPU insufficiente quando si utilizza Horizon J5 come BEV Transformer. Come hai utilizzato J5 per farlo?
Hou Cong:Basta non usare Transformer. BEV Transformer è stato pubblicizzato da Tesla, ma nel mondo accademico ci sono molti modi per mappare le caratteristiche dell'immagine nello spazio BEV. Transformer è solo un metodo Usiamo un metodo più adatto per J5 e l'effetto è molto buono.
Approfondimento: la prossima generazione Horizon J6 passerà alla soluzione BEV Transformer?
Hou Cong:Considerando il rapporto costi/benefici, se l'utilizzo di Transformer consuma molta potenza di calcolo ma produce un output minimo, prenderemo in considerazione tutto. Ma utilizzeremo sicuramente Transformer per implementare alcune cose, tra cui attività end-to-end, senza mappe e alcune elaborazioni di mappe. Il valore dell'utilizzo di Transformer in quest'area è piuttosto elevato.
Più persone lo usano, maggiore è la sfida.
Approfondimento: stai attualmente sviluppando il sistema AD Pro ideale. Ci sono delle sfide?
Hou Cong:La difficoltà più grande è che la sua base di utenti è molto ampia e i suoi requisiti sono molto elevati. Più persone lo usano, più problemi esporrà data una certa probabilità. Quando hai solo migliaia o decine di migliaia di utenti, può accadere una volta al mese o una volta ogni pochi mesi. Ma se centinaia di migliaia di persone lo utilizzano, potrebbe accadere una volta alla settimana o più giorni. Ciò ha anche a che fare con la copertura degli utenti. Migliore è il prodotto, più persone lo utilizzano e maggiori saranno i problemi che esporrà. È sicuramente difficile garantire che il sistema non abbia problemi di stabilità o sicurezza.
Insight: Qual è un problema difficile che hai risolto di recente?
Hou Cong:Identificare i semafori è in realtà un problema difficile. In così tanti incroci in tutto il Paese, l'aspetto, le regole e il rapporto tra semafori e strade sono tutti diversi. Alcune luci sono semplici luci rosse, gialle e verdi, alcune sono su due file, ci sono anche luci molto lunghe con frecce all'interno, e all'interno ci sono luci per biciclette e autobus, e alcune luci hanno forme strane. È temporaneo.
Considerare anche lo sfondo chiaro, ad esempio di notte. A causa delle limitazioni del sensore, potrebbe essere difficile distinguere le forme delle frecce e dei cerchi quando sovraesposti. Inoltre, l'interferenza di molte luci sullo sfondo avrà un impatto maggiore sul sistema.
Inoltre, la luce LED lampeggia costantemente, il che potrebbe interferire con l'identificazione. Al giorno d'oggi le fotocamere sono già dotate della funzione antistroboscopica, ma anche così le frequenze di alcune luci potrebbero non corrispondere.
Yunjian Insight: Il problema dell'identificazione dei semafori dovrebbe essere riscontrato anche da altri sistemi.
Hou Cong:Stesso. I principi sono simili, ma poiché l'hardware è diverso, anche i metodi saranno diversi. Più potenti sono le tue capacità hardware, più metodi puoi utilizzare. Il punto più importante è il numero di situazioni diverse nel paese coperte dai dati.
Approfondimento: qual è il limite massimo delle capacità del modello AD Pro basato su Horizon J5?
Hou Cong:Funziona meglio in autostrada.
Yunjian Insight: Yu Kai ha menzionato prima che la potenza di calcolo della CPU del chip J5 era insufficiente a causa dell'insufficiente investimento in risorse quell'anno. Ma NVIDIA investe ogni volta in anticipo.
Hou Cong:Ognuno ha idee diverse. NVIDIA sta puntando alla fascia alta, ma i suoi costi ci sono e non può continuare. È più adatto alla modalità di studio autonomo. L'ecologia è relativamente completa e il costo di sviluppo è relativamente basso. Ma se vuoi realizzare un modello conveniente, devi comunque scegliere un chip più conveniente.
Approfondimento: utilizzate solo chip Horizon?
Hou Cong:L'obiettivo della progettazione del nostro sistema è essere in grado di adattarsi a una varietà di chip. Per raggiungere questo obiettivo, abbiamo fatto alcuni sacrifici. Forse non massimizziamo il ruolo di ciascun chip al 100%, ma è abbastanza buono. Potrebbe essere meglio investire di più, ma il rendimento marginale è molto basso. Horizon è ora la nostra piattaforma e il nostro partner più importante e continueremo sicuramente a basarci su di esso. Ma il nostro sistema non è progettato solo per l’orizzonte.
I nostri minibus utilizzano da sempre NVIDIA. Quando lavoravo su L4 all'inizio, utilizzavo NVIDIA Xavier per l'accesso ai sensori e eseguivo anche alcuni algoritmi. NVIDIA Orin sarà rilasciato nel 2022 e noi saremo i primi utenti. A quel tempo, abbiamo collaborato con un produttore e nel giro di un mese abbiamo migrato il sistema dai computer industriali a NVIDIA Orin. Questo partner è un'azienda di fama internazionale. Ha segnalato questa situazione a NVIDIA NVIDIA l'ha evidenziata alla conferenza GTC di quell'anno.XiaopengEMolto kryptoniano) in parallelo, il primo a utilizzare i doppi chip Orin di Nvidia.
Insight: cosa ne pensi della transizione di Nvidia dalla produzione di chip alla realizzazione di soluzioni di guida autonoma?
Hou Cong:Deve costruire un progetto modello che lo aiuti a vedere il futuro dei chip in modo più accurato. Quanta potenza di calcolo è richiesta e di quali funzioni ha bisogno il sistema deve essere conosciuta.
In effetti, ha pubblicato un documento completo sei o sette anni fa, ma non è mai stato in grado di lavorarci sopra. Wu Xinzhou è stato punito in passato, ma non completamente. Ritengo che potrebbe essere meglio creare un modello. Se questo viene fatto bene, può essere trasformato in una soluzione standardizzata e possiamo fare un ulteriore passo avanti.
Dopo aver realizzato il progetto prototipo, puoi anche aiutarlo a vendere i chip.
Yunjian Insight: È necessaria molta manodopera per consegnare ogni modello realizzato? Oppure è una soluzione generale che può essere utilizzata per tutte le auto?
Hou Cong:Dipende da come il sistema lo identifica. Questo è in realtà molto critico. Huawei, ad esempio, spera sicuramente di diventare un super fornitore e di ridurre i costi di consegna. I sensori di Huawei sono tutti definiti a sé stanti, ma generalmente le case automobilistiche li sostituiranno secondo la propria catena di fornitura. Innanzitutto non cambia la fotocamera e anche la posizione di installazione è relativamente standard. Le fotocamere anteriore e posteriore di questo modello sono riunite in un modulo. In questo modo la posizione di installazione è relativamente fissa e i successivi costi di adattamento vengono ridotti. Le ubicazioni approssimative dei SUV e delle berline sono le stesse, così come i modelli sono gli stessi, quindi i costi di consegna devono essere bassi.
Non voglio più essere di livello 1
Yunjian Insight: Hai appena detto che tutto ciò che Tesla ha fatto era giusto, ad eccezione di Robotaxi, inclusa la produzione dei propri chip?
Hou Cong:Giusto. Produce due chip propri, uno per l'auto e uno per quello offline. Nel 2019, il veicolo non aveva un chip con una potenza di calcolo così elevata ed è stato in grado di eseguire il BEV così presto grazie a questo chip.
Il chip Orin di Nvidia non sarà rilasciato prima del 2022, ma Tesla ha già prodotto un BEV nel 2021, guidando il mercato da oltre un anno. Inizialmente ha utilizzato i chip di Mobileye e successivamente i Drive PX di Nvidia. I prezzi di Nvidia non sono riusciti a scendere, quindi ha dovuto crearne uno proprio per ridurre i costi.
Yunjian Insight: Quindi è ragionevole che le case automobilistiche imparino da Tesla e sviluppino i propri chip?
Hou Cong:Tesla ha le dimensioni per farlo. Altre case automobilistiche hanno imparato in questo modo, il che potrebbe non essere corretto.
Yunjian Insight: Le aziende automobilistiche, le società di chip e i fornitori di soluzioni di guida autonoma stanno attualmente reinventando la ruota. Come pensi che si evolverà la divisione industriale in futuro?
Hou Cong:Lasciamo che sia il mercato a dimostrare tutto. Lo scopo di ciò non è necessariamente semplice. Potrebbero esserci altri scopi, come modellare l’immagine dei marchi tecnologici, inclusa la gestione del valore di mercato e l’attrazione dei talenti.
In teoria, in termini di sicurezza e costi della catena di approvvigionamento, le aziende automobilistiche presentano alcuni vantaggi nei chip sviluppati internamente, ma è necessario considerare il costo complessivo. Il problema più grande nel creare un chip è che lo fai e scopri che esiste un nuovo algoritmo e che il tuo hardware è lento. Tutti si affrettano a eseguire quell'algoritmo e il tuo chip non può essere utilizzato.
Approfondimento: stai parlando di Horizon J5?
Hou Cong:J5 è un caso di studio. Ma penso che non sia solo J5, quella generazione di chip, finché non sono universali, hanno tutti questo problema.
Yunjian Insight: L'architettura tecnica si è stabilizzata ora?
Hou Cong:NO. Anche il trasformatore è oggi messo alla prova e ci sono tecnologie nuove e più efficienti. Ci sarà anche un processo di convergenza.
Yunjian Insight: È ragionevole che i produttori di chip sviluppino soluzioni di guida intelligente?
Hou Cong:Non credo che il vantaggio sia evidente. Quando i produttori di automobili collaborano con i produttori di chip, possono sperare di ottenere aiuto, che implica alcuni sviluppi di base, che si tratti di driver, software di base, elaborazione dei segnali dei sensori o ragionamento sulla rete neurale. Tuttavia, il costo per i produttori di chip per fornire tali servizi è piuttosto elevato e non può servire tutte le case.
A meno che non si riesca a rendere la filiera molto matura, ma questo richiede tempo. È difficile per le start-up di chip raggiungere una tale maturità in questo settore e devono controllarsi. O pochi partner ecologici possono dominare il mercato. Tuttavia, anche le case automobilistiche hanno esigenze di autosviluppo e non vogliono fare affidamento su partner ecologici. Ci vuole tempo anche perché i partner ecologici crescano ed è impossibile riempire rapidamente questo mercato.
In questo momento, i produttori di chip sentiranno sicuramente di poter risolvere questi problemi facendolo da soli.
Insight: quanta manodopera è necessaria per completare un progetto?
Hou Cong:In generale, il primo progetto è quello ad alta intensità di manodopera e l’investimento diminuisce man mano che i progetti vanno avanti.
Insight: quanti progetti puoi realizzare contemporaneamente adesso?
Hou Cong:Due o tre progetti. L’attuale investimento in un singolo progetto non è ancora ottimale. Dopo il quinto progetto, praticamente ogni progetto richiede solo poche decine di persone per essere completato e non è un problema portare a termine cinque o sei progetti.
Yunjian Insight: I fornitori di guida autonoma dovrebbero assumere più persone per intraprendere più progetti o dovrebbero controllare le dimensioni del proprio personale e intraprendere solo un numero limitato di progetti?
Hou Cong:Considera gli obiettivi strategici. Se vuoi occupare il mercato, espandere la portata, continuare a raccogliere fondi, quotarti in borsa e intraprendere più progetti in questo modo di alto profilo. Un altro tipo è quello di stabilire prima dei parametri di riferimento, coltivare le capacità, standardizzare i prodotti e poi copiarli rapidamente. Si inizia con solo uno o due progetti, stabilendo prima i parametri di riferimento, ma i prodotti sono standardizzati e non ci sarà molta personalizzazione per la promozione successiva. Questa è un'altra idea.
Insight: Perché hai scelto la seconda strada?
Hou Cong:Perché più riceviamo adesso, più perderemo e l'azienda è sottoposta a una forte pressione operativa. Riteniamo che il mercato finale debba essere limitato a pochi fornitori e che la standardizzazione dei prodotti debba essere effettuata correttamente.
Insight: Man mano che questo settore si evolve, quale ruolo giocherai nella catena in futuro?
Hou Cong:Svilupperemo almeno uno o due chip in una determinata categoria di prodotti di fascia medio-alta e forniremo una soluzione standardizzata. Alla fine potremmo diventare un'azienda di livello 2. Ci occupiamo di algoritmi e distribuzione di software, ma non del set completo. C'è un fornitore di sistemi che conclude queste cose.
Insight: perché non esegui il Livello 1?
Hou Cong:Non eseguiamo il Tier 1 del sistema, ma eseguiamo il Tier 1 del software (Tier 2 del sistema). Il livello 1 del sistema richiede molto hardware, l'investimento è piuttosto elevato e il profitto è relativamente ridotto. Considereremo anche questa direzione, ma attualmente il Tier 2 è più fattibile.
Yunjian Insight: il livello 1 è responsabile del ruolo di controller del dominio?
Hou Cong:Devo ancora effettuare le consegne. Richiederà più manodopera, il che non è un nostro vantaggio.
Approfondimento: quali sono i vantaggi?
Hou Cong:Sto ancora realizzando algoritmi e prodotti. Penso che Qingzhou non sia un'azienda geneticamente in grado di raggiungere l'hardware di livello 1. Si tratta di un tipo diverso di azienda, come Desay SV e Joyson Electronics.
Intuizione: Ma la tua collaborazione con Ideal fa sì che tu sia il Livello 1 di Horizon.
Hou Cong:Siamo come software di livello 1. Il Livello 1 esisterà ancora per un po’ nel breve termine, ma alla fine verrà standardizzato. Dopodiché creeremo il nostro hardware oppure realizzeremo il Livello 2.
Yunjian Insight: Quindi secondo te, in futuro, i fornitori di soluzioni di guida intelligente collaboreranno con le case automobilistiche, il sistema Tier 1, l'algoritmo Tier 2 e il chip Tier 2?
Hou Cong:Giusto.
Yunjian Insight: Il chip Tier 2 non può svolgere il lavoro dell’algoritmo Tier 2?
Hou Cong:Vedi se in questo è più bravo di noi.
Yunjian Insight: Se fornisce un algoritmo standardizzato, anche i chip Tier 2 dovrebbero volerlo fare.
Hou Cong:Perché deve farlo da solo? Collabora semplicemente con noi.