notizia

Hou Xiaodi, l'uomo cauto e coraggioso

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Ora non è il momento della concorrenza nel settore della guida autonoma.


Testo |. Tian Siqi
Fonte dell'articolo|Jia Zi Guangnian (ID: jazzyear)

Nello stesso momento in cui Tesla ha annunciato la sua relazione finanziaria del secondo trimestre, Musk ha annunciato ufficialmente che il lancio del prodotto Robotaxi sarebbe stato posticipato dall’inizio di agosto all’inizio di ottobre. Hou Xiaodi, che come Musk ha i suoi affari radicati in Texas, ha confermato ancora una volta la sua identità di “profeta”.

In precedenza, Hou Xiaodi era noto soprattutto per il suo viaggio dalla fiducia al sospetto, dalla cooperazione alla separazione, con TuSimple, la "prima società di guida autonoma" da lui co-fondata.

Dopo essere diventato pubblico nell'aprile 2021, il patrimonio netto di Hou Xiaodi ha superato il miliardo di dollari. Tuttavia, con l'avvio delle indagini e della supervisione da parte del Comitato per gli investimenti esteri negli Stati Uniti (CIFUS), Tucson ha vissuto un turbolento cambio di gestione. Hou Xiaodi è stato promosso per la prima volta dalla posizione di CTO a CEO, ed è stato licenziato dal consiglio di amministrazione nell'ottobre 2022, poi lui e un altro co-fondatore hanno rimosso l'ex consiglio di amministrazione tramite un super voto 10 giorni dopo, ma non è mai stato promosso; in grado di tornare alla direzione dell'azienda nel marzo 2023, Hou Xiaodi ha finalmente annunciato la sua completa partenza da Tucson.

Prima della rimozione dalla quotazione nel febbraio 2024, anche il prezzo delle azioni di Tucson è crollato da un massimo di quasi 80 dollari a meno di 1 dollaro.

Alcune persone dicono che la relazione tra Hou Xiaodi e Tucson è come il ruolo di Oppenheimer nel Progetto Manhattan in passato. Proprio come Oppenheimer ha dovuto affrontare dubbi e controlli da tutte le parti negli anni del dopoguerra, le decisioni e le azioni di Hou Xiaodi a Tucson Future sono sempre messe sotto una lente di ingrandimento e ogni scelta che fa può diventare controversa.

Anche così, Hou Xiaodi è ancora orgoglioso di dire a "Jiazi Guangnian" che Tucson è la prima azienda al mondo a testare camion pesanti completamente senza conducente su strade aperte e ha raggiunto la prima metà del gioco della guida senza conducente - facendo Non c'è sistema ridondante di sicurezza.

Nel maggio di quest'anno, CIFUS ha raggiunto un accordo con Tucson. Secondo l'annuncio di Tucson, questa indagine non ha rilevato alcuna violazione da parte della società, incluso il presunto "trasferimento di tecnologia". Dopo aver lasciato Tucson, Hou Xiaodi si dedicò ancora una volta all'imprenditorialità di camion senza conducente di livello L4 e fondò una nuova società Bot.Auto negli Stati Uniti.

Quando la guida assistita L2 sostituì gradualmente nell'opinione pubblica la guida senza conducente L4, Hou Xiaodi insistette sulla ricerca e sullo sviluppo della L4 e guidò su questa strada prudente e coraggiosa. Ma vede la direzione diversa da quella tradizionale come un'opportunità entusiasmante: "O diventi un bravo studente con 100 punti ogni giorno, oppure usi un'opportunità irripetibile per incidere su una visione rivoluzionaria, anche se c'è è maggiore incertezza e minore consenso da parte del settore, sono anche disposto a fare un miracolo con una piccola probabilità. Naturalmente, il nostro team ha competenze uniche e lavora insieme, credo che possiamo realizzare questo miracolo.

La sua visione rivoluzionaria è quella di far sì che i camion senza conducente operino a un costo per chilometro inferiore rispetto agli esseri umani sulla base del concetto di Transportation as a Service (TaaS), creando così più valore sociale. Dal punto di vista finanziario, il nodo per la realizzazione dei sogni è stato inizialmente fissato nella prima metà del 2026.

In questa intervista esclusiva, Hou Xiaodi ha commentato eventi del settore come il rinvio di Robotaxi e la partenza della "Carrot Run" domestica, e ha espresso molti giudizi che non possono piacere a tutti, come "Il pubblico ha molte critiche sulla guida autonoma , perché tutti pensano tutti di saper guidare.

Costretta dal torrente dei tempi, la storia di Hou Xiaodi e TuSimple è destinata a diventare una svolta tragica e tragica. Questo gli ha ricordato che la creazione e la protezione sono ugualmente importanti e che la protezione è più difficile, quindi questa volta ha scelto il ruolo di guardiano. “In passato, mi mettevo troppo in posizioni tecniche, ed essere molto abile equivale a una bellezza che copre tutti i difetti”, ha detto Hou Xiaodi, “ma ora devo ancora trasformarmi in un guerriero esagonale per proteggere il azienda in tutti i suoi aspetti”.

Quella che segue è l'intera intervista, modificata e organizzata:


Sfide di sicurezza di Robotaxi e L4

Jiazi Guangnian: Prima di tutto, vorrei congratularmi con te per essere diventato ancora una volta un vero profeta riguardo al rinvio di Robotaxi.

Hou Xiaodi: Allora tutti dovrebbero abituarsi, ho molte previsioni. Ho già detto in precedenza che la legge sullo scaling non è la risposta e mi oppongo fermamente al leggismo sullo scaling. Ad esempio, alla conferenza GTC, tutti ritenevano che NVIDIA fosse onnipotente, ma io sentivo che il miglioramento delle prestazioni di NVIDIA nell'edge computing aveva raggiunto il suo limite.

Spesso getto acqua fredda sull'entusiasmo delle persone, che riflette essenzialmente il mio diverso atteggiamento nei confronti delle aspettative future. Se vuoi una previsione audace, basta avere un atteggiamento ottimista. Ma se vuoi una previsione accurata, basala sulla conoscenza e sulla logica. Prendiamo come esempio la fisica delle scuole medie. I civili possono parlare di acqua che si trasforma in petrolio o di macchine a moto perpetuo, ma finché avrai imparato la conservazione della massa e dell'energia, e poi sentirai parlare di macchine a moto perpetuo, saprai che stanno ingannando. .

Per me, quando vedo una previsione, ciò a cui devo veramente pensare è il supporto teorico dietro il problema. Il futuro trend di sviluppo della tecnologia è limitato dalle leggi della fisica e della matematica. Dovremmo rispettare queste restrizioni.

Jiazi Guangnian: Prima hai detto che il Robotaxi di Musk non può essere costruito, e ora il suo rilascio è stato nuovamente ritardato, il che conferma parzialmente la tua affermazione. Cosa ne pensi della decisione di rinviarlo?

Hou Xiaodi: Le prestazioni attuali di Robotaxi sono lontane dal vero L4. Qualche mese fa, un mio amico ha elogiato così tanto Tesla che gli ho suggerito di fare un giro di prova su Waymo. Di conseguenza, quel giorno mi disse: "Xiaodi, ho guidato a Waymo. Tesla è davvero spazzatura".

(Nota: Waymo è una società di guida autonoma di proprietà di Alphabet, la società madre di Google, e ha lanciato servizi di taxi senza conducente in California, Texas e in altri luoghi.)

Robotaxi non viene rilasciato risolvendo uno o due bug e ritardandolo di due mesi. Quindi continuo a fare previsioni: il 10 ottobre non sarà ancora il momento in cui Robotaxi verrà effettivamente rilasciato, e nemmeno l'anno prossimo sarà il momento in cui potrà essere applicato. Nella migliore delle ipotesi, non ci saranno indizi su quando Robotaxi uscirà effettivamente questo ottobre.

Jiazi Guangnian: Perché ritieni che Tesla Robotaxi non possa essere fatto dopo aver guidato a Waymo?

Hou Xiaodi: Il comportamento di Waymo può darti maggiori certezze. Quando ho provato a guidare la Tesla di mia moglie, che è l'ultima versione di FSD, ho visto che molti salti comportamentali erano molto gravi e non erano stati progettati dal punto di vista della minimizzazione della responsabilità per gli incidenti stradali. Molti dettagli dell'algoritmo sono stati fatti scarso e mi fa sentire che non è proprio al livello L4.

Oltre all’essenza tecnica, c’è anche l’essenza commerciale. C'è una battuta su cosa succederebbe se qualcuno venisse ucciso mentre guidava un FSD su una Tesla? La mia risposta è un gioco di parole: non sono affari loro. In termini di divisione delle responsabilità, Tesla afferma decisamente che il conducente è pienamente responsabile (il sistema suggerisce chiaramente che quando si utilizza FSD, il conducente deve tenere le mani sul volante dall'inizio alla fine e continuare a prestare attenzione alle condizioni della strada) , e non ha nulla a che fare con noi; in secondo luogo, questo non è il suo modello di business: vendere automobili e FSD è il valore aggiunto della vendita di automobili. Se vuoi considerare come vendere più auto, non puoi approfondire un'area limitata come L4 e risolvere tutti i casi limite (situazioni estreme) in quest'area.

Jiazi Guangnian: Quindi pensi che la sua logica non sia quella di minimizzare gli incidenti stradali, ma di massimizzare gli interessi commerciali minimizzando al contempo la responsabilità di Tesla.

Hou Xiaodi: Il primo è ridurre al minimo la responsabilità di Tesla, il secondo è massimizzare gli interessi commerciali. Ora ci sono tre casi, caso migliore (caso migliore), caso medio (caso medio) e caso peggiore (caso peggiore). Tesla ottimizza lo scenario migliore. La guida assistita stessa ha il suo valore Finché i consumatori la riconoscono, la sua missione è stata raggiunta.

Jiazi Guangnian: Musk non ha introdotto molti dettagli su come ottenere l'approvazione normativa durante la riunione del rapporto finanziario, ma ha sempre sottolineato che Tesla è una cosiddetta soluzione universale, che potrebbe essere migliore della soluzione più localizzata di Waymo. La soluzione di Waymo è troppo fragile. .

Hou Xiaodi: Questo è un tipico sofismo. Come definisci la vulnerabilità? Posso viaggiare in tutto il mondo, posso farlo in ogni città, ma puoi farlo solo in una piccola area, quindi sei vulnerabile. Ma la questione della competizione L4 era se avremmo potuto fare bene in questa piccola area limitata. Di conseguenza, ha detto, non sono in competizione con te su questo, competo con te su quello. Ciò equivale a chiedere chi è più bello, io o il signor Xu del nord della città. Insiste che non sono più bello di chi sono più intelligente. Cosa dovrei fare se il signor Xu del nord della città è più intelligente di te e più bella di te? Ha anche detto che correvo veloce. Ad ogni modo, non voglio competere apertamente in un ambiente limitato.

Non esiste un’unica tecnologia che possa essere utilizzata per la guida senza conducente in nessuna parte del mondo, proprio come non esiste un singolo atleta alle Olimpiadi che possa essere utilizzato sia per la corsa su lunga che su breve distanza. Se stai girando una scena limitata, falla bene. Se vuoi vendere auto in tutto il mondo, non creare un marchio automobilistico, dì semplicemente che sei L2+. Non mi piace confondere le masse con il marketing, più forte è il rumore, maggiore è la pressione sulle persone serie.

Jiazi Guangnian: Al momento, le sfide tecniche della L4 sono ancora relativamente grandi? A quali livelli si riferiscono nello specifico?

Hou Xiaodi: In generale, non è difficile per coloro che riescono a padroneggiarlo, ma non è difficile per coloro che sono difficili. Penso che il nostro team possa superare le difficoltà che altri hanno riscontrato una per una e apportare ulteriori innovazioni e sviluppi basati sul documento.

Il nucleo di L4 senza driver è come completare un sistema stabile, in particolare utilizzando moduli instabili per completare un sistema stabile. Ad esempio, se la fotocamera non riesce a rilevare un oggetto in un fotogramma, accadrà sicuramente questo genere di cose. La chiave è come garantire che il nostro sistema non collassi.

Il modo stupido è ridurre il tempo di guasto di 100.000 chilometri al tempo di guasto di 1 milione di chilometri, in modo che il sistema sia stabile. La soluzione intelligente è innovare a livello di architettura, in modo che se un modulo fallisce, ci saranno altri moduli a coprirlo. Mettiamo in atto alcuni ulteriori livelli di piani di copertura in corso in modo da poter gestire il guasto del sistema in qualsiasi momento. Gli aerei dell'aviazione civile sono un tipico sistema ridondante. Gli aerei solitamente hanno due motori, progettati per essere funzionalmente sicuri e indipendenti l'uno dall'altro. La sicurezza del sistema si ottiene attraverso un'architettura più avanzata, non creando un unico motore che non si guasta mai.

Jiazi Guangnian: Questo per prepararsi alla ridondanza della sicurezza.

Hou Xiaodi: Nello specifico, si tratta di rendere realizzabile la ridondanza della sicurezza in ingegneria. Con l’attuale livello tecnologico, l’utilizzo di componenti maturi forniti dall’ecosistema del settore per costruire un sistema sicuro e ridondante è il compito più importante della guida autonoma.

Alcuni dicono anche che L2 può svilupparsi gradualmente in L4, ma non sono d'accordo con questo. La nostra ricerca L4 dedica il 70% del nostro tempo a sistemi ridondanti. Non importa quanto sia buona la funzione L2, può completare solo al massimo tre funzioni di L4 e il restante 70% delle funzioni non è stato toccato. Tesla non è un'azienda L4, ma un'azienda L2+ e molti dei suoi progetti non hanno scopi di sicurezza o ridondanza.


Trasporto come servizio

Jiazi Guangnian: Hai sempre aderito al percorso L4, ma ora l'industria e il pubblico sembrano discutere più della guida assistita L2 che della guida autonoma.

Hou Xiaodi: Il successo mio e di Bot.Auto non ha nulla a che fare con il fatto che sia mainstream. Non abbiamo bisogno dell’approvazione di tutti. Se riusciamo effettivamente a creare valore economico o anche valore sociale, questo è sufficiente.

Il percorso tecnico è determinato da leggi oggettive e la correttezza del percorso ha poco a che fare con il consenso. Soprattutto nel campo della guida autonoma. Il pubblico ha molte critiche nei confronti della guida autonoma, non perché tutti siano praticanti senza conducente, ma perché tutti pensano di poter guidare. Se si pensa ad un “consenso” sulla tecnologia senza conducente discusso da un gruppo di conducenti umani, conterrebbe molte cose inaffidabili. Se davvero ci sviluppassimo secondo il giudizio del pubblico, sarebbe un vicolo cieco.

Rispetto alle persone che sanno guidare, ci sono molte meno persone che sanno guidare i razzi. Pertanto, il campo della produzione di razzi è relativamente fortunato e non si sono verificate molte tragedie in cui il consenso dei profani guida il percorso tecnico degli esperti. Sulla base di questa idea, il campo LLM è l'area più colpita da questo tipo di "rumore di percorso".

Questo tipo di rumore proveniente dal percorso, a sua volta, ha un grande impatto sui praticanti della guida autonoma e addirittura lo danneggia. Dovremmo sopportare la pressione, resistere al rumore e attenerci agli obiettivi a lungo termine, oppure dovremmo dire prima quello che gli investitori amano dire e ottenere finanziamenti e sopravvivere per raggiungere gli obiettivi a breve termine? La maggior parte delle persone in realtà sceglie quest’ultima.

Diventa un bravo studente con 100 punti ogni giorno oppure sfrutta un'opportunità irripetibile per avere un impatto su una visione rivoluzionaria. C’è maggiore incertezza e meno consenso da parte del settore, e sono disposto a fare miracoli con una piccola probabilità. Naturalmente, tutto il nostro team ha competenze uniche e lavoriamo insieme come uno solo, credo che possiamo realizzare questo miracolo.

Coloro che investono in ciò che piace agli investitori e parlano ogni giorno di opinioni consensuali si stanno semplicemente godendo il processo di avvio di un'impresa. Ma non mi piace il processo di avvio di un’impresa, vedo solo il risultato finale. Alla fine, è la luce della speranza che questa causa possa essere portata a termine con successo e questa visione finale che mi attrae. Per fare le cose, dobbiamo rispettare le inevitabili leggi della scienza e degli affari e non dobbiamo necessariamente soddisfare la percezione pubblica. In molti casi, dobbiamo anche resistere alla tremenda pressione esercitata dall’andare contro la percezione pubblica e aderire alla verità.

Jiazi Guangnian: Se qualcosa è diverso dalla percezione pubblica, aumenta il suo fascino per te?

Hou Xiaodi: È diverso dal mainstream. È solo l’inizio. Il prossimo lavoro essenziale è un processo di ricerca della verità basato sui fatti. Se alla fine questa “cognizione differenziata” è logica, allora si può dire che ha un grande valore e potenziale. Ma scoprire percezioni diverse non significa che ci siano nuove opportunità! Ovviamente ne sarei entusiasta. Un tipico esempio è che tutte le aziende che producono camion senza conducente negli Stati Uniti sono SaaS, che è il modello Software as a Service (Software as a Service). Naturalmente, possono anche confezionarlo come Hardware as a Service (hardware come servizio) senza cambiare la medicina. In sostanza, vendono prodotti semilavorati. Noi, Bot.Auto, siamo l'unica azienda che gestisce il trasporto come servizio e vendiamo servizi di trasporto.

Jiazi Guangnian: come definire il trasporto come servizio?

Hou Xiaodi: Se hai la merce, te la trasporterò. I nostri clienti non hanno bisogno di sapere se la merce viene trasportata con guida senza equipaggio o con equipaggio. In ogni caso, la capacità di trasporto è sufficiente e il trasporto è conveniente. Altri vendono software di guida autonoma. Il problema è che ci sono solo 20 clienti negli Stati Uniti che possono acquistare software di guida autonoma.

Jiazi Guangnian: Con il concetto di trasporto come servizio, qual è la tua visione rivoluzionaria?

Hou Xiaodi: Lasciamo che il costo operativo per chilometro della guida autonoma sia inferiore a quello degli esseri umani.

Jiazi Guangnian: Quando potrà essere realizzato?

Hou Xiaodi: Nella prima metà del 2026. Ci sono ancora due anni per lavorare ancora duro.

Jiazi Guangnian: Questa volta c'è il consenso del settore?

Hou Xiaodi: Ovviamente non c’è consenso. Altri non ci credono e i colleghi non hanno la capacità di fornire un punto temporale. Ad esempio, la storia raccontata da Waabi (un’azienda di guida autonoma fondata nel 2021) è che la simulazione è la migliore al mondo. Tutto è proprio come il mondo reale e non ci sono problemi che la simulazione non possa risolvere. Ma non credo a questa storia, perché l’ultimo 1% dei problemi di simulazione sono i più difficili. L’assolutismo su questo punto non è in linea con l’efficienza economica.

Naturalmente, questo è solo il mio giudizio tecnico e il giudizio sul percorso derivato. Per essere onesti, ognuno vive secondo le proprie convinzioni e il processo per avviare un'impresa è realizzare le proprie convinzioni.

Jiazi Guangnian: Hai detto che molte persone puntano il dito contro la guida autonoma perché pensano di poter guidare. È simile a come dopo l'esame di ammissione all'università, tutti puntano alle domande sul saggio invece di discutere domande di matematica?

Hou Xiaodi: Esatto. La maggior parte delle persone riesce a vedere le somiglianze nei fenomeni L2/L4, ma non riesce a vedere il divario nell'architettura e nella progettazione del sistema tra L2/L4. Aerei e razzi volano nel cielo. Un profano può facilmente vedere che gli aerei volano sempre più velocemente e sostituiranno i razzi tra due giorni. Ma se hai studiato fisica, sai che gli aeroplani non possono volare fuori dall'atmosfera, ma i razzi sì. Gli outsider si affidano a estrapolazioni eccessivamente ottimistiche, mentre i veri insider ritornano agli elementi essenziali della fisica.

Jiazi Guangnian: Domestic Carrot Run è stato molto popolare di recente e le persone lo criticano molto sia a livello tecnico che sociale. Hai prestato attenzione a come funziona?

Hou Xiaodi: Prima di tutto devo confermare che è una buona cosa e voglio applaudire Baidu. I primi promotori che si trovano sotto i riflettori dovranno affrontare enormi incomprensioni da parte del pubblico. Educare il pubblico su questo processo è vantaggioso per l’intero settore.

Ma devo ancora dire che le discussioni a livello sociale sono estremamente noiose, estremamente disordinate ed estremamente inefficaci. Alan Kay (vincitore del Premio Turing nel 2003) ha affermato che le persone sovrastimano sempre le scoperte a breve termine della tecnologia a breve termine, ma sottovalutano l’impatto a lungo termine della tecnologia. Quale impatto avrà sui tassisti la diffusione di 400 auto a guida autonoma? Il lancio di 400 veicoli oggi ha un buon effetto, ma se qualcuno teme che domani ne verranno lanciati 40.000, è del tutto infondato. Al momento nessuno ha la capacità di promuoverla su così larga scala. Questo è proprio il problema di produzione tecnica che la guida senza conducente deve risolvere.

Pensare che la guida autonoma sarà possibile domani significa sopravvalutare le scoperte a breve termine. Allo stesso tempo, il pubblico tende a sottovalutare l’impatto a lungo termine. Ad esempio, la nostra struttura fiscale e le nostre abitudini di viaggio cambieranno in futuro? Come è cambiata la pianificazione urbana? Un numero maggiore di aree suburbane potrebbe diventare vivibile e le persone potrebbero lavorare mentre sono pendolari. Questo è il vero impatto a lungo termine da considerare.

Jiazi Guangnian: Come hai detto prima, immagineremo tutto ciò che è nella fantascienza. Ma oggi ci sono così tante cose che si possono fare con i telefoni cellulari che 100 anni fa non erano scritte nei romanzi, ma che hanno effettivamente portato cambiamenti significativi nel nostro stile di vita.

Hou Xiaodi: Le invenzioni tecnologiche sono scoperte in un unico punto nella complessa rete della società umana, e le scoperte in un singolo punto possono indurre un gran numero di cambiamenti complessi correlati. I limiti dell’immaginazione umana possono rendere impossibile pensare con chiarezza a così tanti fattori correlati, quindi non possiamo criticare i romanzi di fantascienza per non essere sufficientemente specifici. Dobbiamo ammettere che queste connessioni sono molto complesse ed è difficile per noi prevedere come sarà la forma sociale a causa delle nuove tecnologie, ma non dovremmo andare agli estremi nel nostro modo di pensare e sollevare problemi di disoccupazione quando arriva una nuova tecnologia. fuori. Come individuo sociale, potrebbe esserci il rischio di disoccupazione indipendentemente dalla presenza o meno di nuove tecnologie. Considerata la società nel suo complesso, le nuove tecnologie apportano cambiamenti sociali più ampi. Questo cambiamento include la nascita di nuove industrie, il declino di vecchie industrie e la migrazione dell’occupazione. Non è affatto un semplice e grossolano problema di disoccupazione.


End-to-end, basato su regole e principi

Jiazi Guangnian: Come interpreti le soluzioni end-to-end attualmente promosse nel settore della guida autonoma?

Hou Xiaodi: Molte cose vengono dette indiscriminatamente da persone che non conoscono il settore, il che porta ad una confusione di concetti. È come se dicessi ai Guns N' Roses che sono un fan dell'heavy metal e che tu sei il mio preferito. I Guns N' Roses devono essere preoccupati per te, perché non sono heavy metal ma hard rock. Gli AC/DC sono anche hard rock, i Judas Priest, i Black Sabbath e i Metallica sono heavy metal.

Le persone mi chiedono sempre, sei end-to-end? Per mantenere il rigore accademico, non siamo solo end-to-end. Ma quello che in realtà vuole chiedere è: avete adottato una tecnologia più avanzata Certo che l'abbiamo fatto? La situazione attuale è che "end-to-end" non è un concetto accademico, ma un vettore emotivo. Le persone che non sono informate possono facilmente attribuire i loro sogni incompiuti e gli affari incompiuti nel campo dell'apprendimento automatico al concetto tecnico specifico di "end-to-end".

Jiazi Guangnian: Quindi pensi che il concetto di end-to-end abbia "occupato il nido della gazza" e le persone equiparano end-to-end ad alta precisione.

Hou Xiaodi: Il vantaggio dell'end-to-end è che puoi pensare a una parte della rete neurale come modulare e la larghezza di banda di comunicazione e connessione tra i moduli è molto elevata. Il secondo vantaggio è che durante l'addestramento del modulo si può ottenere la propagazione degli errori e gli errori possono essere trasmessi ai moduli precedenti. Ad esempio, l'addestramento alla pianificazione del movimento può influenzare direttamente la percezione. Ma il fine non coincide con i mezzi. Non è necessario essere ossessionati dalla tecnologia specifica "end-to-end". Anche molte altre tecnologie hanno tali caratteristiche.

E devo criticare l’idea che “il connessionismo risolva tutto”. C'è sempre l'idea sbagliata che tutte le reti end-to-end debbano essere reti neurali. Se aggiungo qualcosa che non è una rete neurale, non sarò abbastanza puro e rivoluzionario. Ciò è molto scomodo. Le tre principali scuole di intelligenza artificiale: connessionismo, comportamentismo e simbolismo, hanno ciascuna i propri punti di forza. Una dottrina non può risolvere tutti i problemi.

In questo senso, mi piace molto lo stile di DeepMind, come AlphaGeometry, che recentemente ha risolto molto bene il problema, secondo me. Da AlphaGo ad AlphaGeometry, DeepMind è sempre stato inclusivo. Tira fuori il meglio da tutti i generi di intelligenza artificiale. Non verrà coinvolto in controversie dottrinali, ma lavorerà piuttosto su sistemi per risolvere i problemi in definitiva.

(Nota: DeepMind di Google ha utilizzato i due sistemi AlphaProof e AlphaGeometry2 per raggiungere il livello di una medaglia d'argento alle Olimpiadi internazionali della matematica del 2024)

Jiazi Guangnian: La mancanza di spiegabilità end-to-end è un grosso ostacolo?

Hou Xiaodi: Sì! Ciò che è ancora più scandaloso è che alcune persone confezionano la mancanza di spiegabilità in un modo di cui non si vergognano ma di cui sono ancora più contrario. Musk dice ogni giorno con disinvoltura che non scriveremo più codice. Ma le sue parole sono pubblicità e marketing. La pratica ingegneristica è molto più complessa di quanto ha detto. Solo un NaN (Not a Number) causato dalla mancata convergenza durante il processo di formazione, quanti ingegneri sono stati uccisi?

L'effettiva formazione di una rete end-to-end è ancora un modello di sviluppo "in stile officina" pieno di metafisica e richiede in questa fase un perfezionamento manuale da parte di "maestri", piuttosto che il modello di sviluppo di una fabbrica automatizzata. Una volta individuati i dettagli che devono essere migliorati, è necessario prima congelare altre parti irrilevanti della rete, quindi preparare una quantità "appropriata" di dati di addestramento come uno chef cinese che frigge in padella, quindi continuare ad addestrare, testare e iterare.

L’argomentazione più estrema che ho sentito è che la distanza di guida autonoma può essere coperta, il che è un caso limite di decine di milioni di chilometri e molta potenza di calcolo. Questo è tipico di vivere nel tuo mondo fantastico. Se la persona responsabile dell'ascolto della storia (l'investitore) ha in primo luogo un atteggiamento soggettivo così forte - se c'è un modo, ce n'è uno buono e sotto deve essercene uno cattivo - allora pensa a come la persona responsabile del racconto della storia (imprenditore) può concentrarsi su Con l'approccio "data-driven" e "end-to-end", abbiamo fabbricato visioni oltraggiose. I due si completano a vicenda ed è così che vengono create le bolle.

Jiazi Guangnian: Molte case automobilistiche del settore affermano che le loro soluzioni end-to-end saranno presto immesse sul mercato.

Hou Xiaodi: Musk parla di un insieme di parole che non possono essere falsificate a breve termine. Non chiederti perché Robotaxi end-to-end non può ancora essere realizzato. Chiedi semplicemente, non preoccuparti, stiamo addestrando la prossima versione. Semplicemente non abbiamo abbastanza potenza di calcolo o dati. Una volta ho pubblicato una foto su WeChat Moments, che mostrava una carota appesa davanti a un asino. Questo è lo stato degli azionisti di Robotaxi e Tesla.


Fonte immagine:X

Inoltre, Musk è una persona di successo. Credere in Musk e seguirlo sono anche politicamente corretti nell’attuale circolo del venture capital. D'altra parte, questo insieme di parole infalsificabili è facile da usare ed è adatto a tutte le età. I ​​team tecnici di secondo e terzo livello possono perfettamente descrivere il loro divario tecnico come una lacuna nei dati e nella potenza di calcolo. Se i dati non sono sufficienti e la potenza di calcolo non è sufficiente, ti verrà chiesto di inviare denaro! Questo è il circuito chiuso perfetto.

Jiazi Guangnian: Ci sono altre scuole oltre alla loro? Pensi che la tua sia ancora una scuola più tradizionale e basata su regole?

Hou Xiaodi: Il concetto stesso di regole non è chiaro. Le persone possono essere molto soggettive riguardo a cosa sia basato su regole. Ciò facilita gli abusi e alla fine diventa un'"arma" per esprimere emozioni soggettive piuttosto che uno "strumento" per esplorare la logica oggettiva. Il mio ex collega ed ex capo scienziato di Tucson Wang Naiyan ha menzionato nel suo blog il principio basato sui principi piuttosto che quello basato sulle regole, cosa con cui sono d'accordo.

Tutti hanno stigmatizzato il metodo basato su regole, come se ogni metodo basato su regole fosse composto da decine di migliaia di if else. Ma se devi discutere, la rete neurale stessa è in realtà un enorme sistema basato su regole. Apri l'interno della rete, che contiene operatori lineari e operatori non lineari. Ogni operatore non lineare è un'implementazione specifica di if else e la rete neurale è un enorme sistema basato su regole composto da miliardi di if else.

Se qualcuno nel settore scrive decine di migliaia di if else in un linguaggio di programmazione, è semplicemente perché il suo livello di implementazione ingegneristica è troppo basso. I sistemi basati su regole non dovrebbero consentire l'esistenza di decine di migliaia di if else in nessuna circostanza. Questa è la conclusione. La seconda conclusione è che, ad esempio, quando un veicolo può attraversare la doppia linea gialla, una, due o tre condizioni devono essere chiaramente indicate. Nel mio caso questo si chiama basato su regole. Ho questo punto di vista forte. Finché guiderò il team verso la guida autonoma L4, il nostro sistema deve includere regole basate su regole o principi. Non consentirei che venga messo in circolazione un sistema L4 completamente non basato sui principi. Questa è la conclusione della sicurezza.

La base del nostro sistema è un modello di fondazione. Ma sulla sua base, enfatizza la progettazione e l'implementazione dell'interpretabilità. Internamente chiamiamo questo quadro Fondazione per tutti (F2A). ‍

Jiazi Guangnian: Hai perseguito la completa spiegabilità.

Hou Xiaodi: L4 deve essere interpretabile e non può basarsi semplicemente su scatole nere di dati poco chiari.

Ci sono tre elementi qui: requisiti, metodi di progettazione e implementazione ingegneristica. L'interpretabilità è un requisito, sia esso basato sui principi o sull'apprendimento, è un metodo di progettazione e scrivere if-else è un'implementazione ingegneristica. La domanda esiste oggettivamente. Non negarla solo perché il metodo ha dei limiti. Ecco perché ho detto che L4 deve essere interpretabile.

Tra diversi metodi di progettazione, è probabile che ci sia io tra voi e voi tra me. Il suo valore sta nell'evidenziare le principali contraddizioni, non nel discutere: se si discute, tutte le reti neurali sono sistemi basati su regole. Alla fine, il divario qualitativo nell’implementazione dell’ingegneria è più ampio del divario tra esseri umani e cani. Non possiamo utilizzare una scarsa implementazione ingegneristica per negare il ruolo guida dei metodi di progettazione.


Cosa hanno in comune camion e robot

Jiazi Guangnian: Quali sono le differenze tra le sfide tecniche dei camion e delle autovetture? Perché riteniamo che il progresso dei camion autonomi sia più lento di quello delle autovetture?

Hou Xiaodi: I camion sono più vicini alla commercializzazione. Questo è il motivo per cui continuerò a lavorare sui camion senza pilota dopo aver lasciato Tucson. I camion ricevono meno attenzione delle auto, soprattutto a causa del VC. A tutti piace investire in cose con cui entrano in contatto quotidianamente, come i robot umanoidi, ma le regole del traffico per i camion sono molto più chiare che per le auto, e possono definire correttamente in cosa. circostanze in cui dovrei La cosa più importante per me è la tua condotta.

Jiazi Guangnian: Vorrei iniziare facendo una digressione. Quale robot pensi abbia le maggiori prospettive commerciali?

Hou Xiaodi: L'attuale ricerca dei robot umanoidi è come: vedi, la tecnologia è migliorata, quindi dovremmo guardare a questo campo c'è carenza di manodopera, dovremmo guardare a questo campo; Al momento il robot da compagnia su cui tutti possono essere d’accordo è ancora lontano. L’attuale mercato applicativo dei robot è nelle fabbriche. Molti professionisti la pensano come me. I primi scenari di applicazione dei robot sono determinati scenari. Allora perché abbiamo bisogno delle gambe? Ma le gambe sono davvero un punto di comunicazione popolare che può indurre il pubblico ad avere associazioni illimitate con la fantascienza.

Jiazi Guangnian: In altre parole, VC è più preoccupato per i prodotti to-C come le automobili e i prodotti interessanti come i robot umanoidi che non sembrano abbastanza interessanti. Ma gli investitori che si rivolgono a voi sono almeno un po' interessati ai camion. Che tipo di persone sono e quali sono le loro caratteristiche?

Hou Xiaodi: Gli investitori che si concentrano sui camion sono più pragmatici. Oggi, le persone prestano ancora attenzione alle auto senza conducente e più persone guardano i camion che le auto. Negli ultimi anni, più persone guardavano le auto. Ora che il focus si è ristretto, gli investitori che sono in grado di dedicarsi al business della guida autonoma di camion si concentrano sulla possibilità che possa essere redditizio. È molto semplice. Consideriamo solo i costi operativi. Con il progresso della tecnologia, possiamo realizzare profitti in pochi anni. Questi sono tutti calcoli molto semplici.

Jiazi Guangnian: Possiamo dire che i VC a cui piace vedere solo le automobili ora guardano i robot?

Hou Xiaodi: Al giorno d'oggi, la gente pensa che i camion senza conducente possano essere considerati in una certa misura dei robot. Il robot non ha necessariamente gambe e braccia e può correre in una fabbrica. Può essere una scatola sospesa e correre su strade pubbliche. Alcuni dei criteri di valutazione per i robot possono essere assegnati alla guida autonoma, quindi i camion autonomi possono soddisfarli e le società di guida autonoma sono molto economiche rispetto alle società di robot.

Jiazi Guangnian: Quali dei costi attuali sono relativamente alti?

Hou Xiaodi: Posso darti un esempio di un telefono Android. Io stesso sono un utente Android da molti anni. Gli utenti Android nei primi anni utilizzavano questa autodistruzione: "Se non si caricano, lampeggiano". Tuttavia, con la maturazione dei sistemi di telefonia mobile, gli eventi di manutenzione come la ricarica e il lampeggio diventano sempre meno frequenti e anche la guida autonoma L4 sperimenterà un simile processo.

Il nostro compito principale è rendere la manutenzione quotidiana più economica, più breve e più automatizzata. Sebbene Bot.Auto disponga della tecnologia leader a livello mondiale, non ci pubblicizziamo come un'azienda tecnologica, ma come una società operativa pragmatica. Utilizziamo la tecnologia più avanzata al mondo per eseguire bene le operazioni. Non siamo un gruppo di nobili scienziati algoritmici. Siamo semplicemente professionisti con i piedi per terra nel settore della logistica delle merci. Il valore creato dalla tecnologia deve riflettersi nelle operazioni, non nella bellezza della tecnologia stessa.

Jiazi Guangnian: Nello specifico, come garantire che la manutenzione diventi più semplice?

Hou Xiaodi: Ad esempio, è in grado di rilevare se la fotocamera è sporca? Quando pulisci la fotocamera? Chi lo pulirà? Come pulirlo? Quanto tempo ci vuole per rimanere pulito dopo la pulizia? Probabilmente ci sono altre migliaia di domande come questa. Sulla base dell’esperienza passata, vogliamo pensare di rifarlo con la nuova tecnologia automatizzata senza l’intervento del conducente.

Questo settore deve affrontare fondamentalmente due tipi di problemi. Il primo tipo di problema è come costruire un sistema ridondante di sicurezza. Questa è la prima metà del gioco. A quel tempo, Tucson fu la prima e l'unica al mondo a completarla. Pochi giorni fa (azienda americana di autocarri a guida autonoma) Kodiak ha completato un test di guida nel deserto, ma era a una velocità molto bassa, non su una strada aperta, e non ha avuto molta interazione con altri veicoli il punto era l'hardware Ridondante, penso che dovrei anche dare qualche applauso. Ma Tucson è l’unico veicolo al mondo ad aver completato i test su autocarri pesanti completamente senza conducente su strade aperte.


Fonte immagine: TuSimple

Una volta completata la prima metà, avrai un sistema che funziona molto bene, ma è anche molto costoso. Nella seconda parte, dobbiamo considerare di rendere più economici i sistemi costosi. Questo è ciò che stiamo facendo attualmente.

Jiazi Guangnian: Presterete attenzione alle tendenze degli altri camion autonomi?

Hou Xiaodi: Conosco un po’ le tendenze del settore, ma non presto attenzione dal punto di vista della concorrenza. Ora semplicemente non è il momento di competere. Ci sono tre fasi nel settore, vale a dire alpinismo, corsa e boxe. Siamo tutti nella prima fase. La prima fase termina quando un’azienda porta i costi operativi delle auto a guida autonoma alla pari con quelli dei guidatori umani. La seconda fase terminerà quando la capacità aggiuntiva fornita dalla guida autonoma supererà l’attuale carenza di camionisti. Nella terza fase c'è la concorrenza diretta.

Ad esempio, c'è una montagna di neve sulla terra che nessuno ha mai scalato. Voglio essere la prima persona al mondo a scalarla. Dovrei affrettarmi a scalarla adesso? No, voglio esercitarmi, osservare il terreno e arrampicarmi quando tutto sarà pronto. Questo non ha nulla a che fare con il fatto che io sappia che anche altri vogliono sfidare questa montagna di neve.


La maggior parte vuole reclutare veri credenti

Jiazi Guangnian: Quante persone ci sono adesso a Bot.Auto?

Hou Xiaodi: Più di 40 persone.

Jiazi Guangnian: Prima hai detto che ritieni che le aziende a guida autonoma non abbiano bisogno di molte persone. Proprio come le aziende a livello di modello, non è una cosa ad alta intensità di manodopera.

Hou Xiaodi: Negli ultimi anni avevamo bisogno di molte persone perché non c'era nulla nell'ecosistema. Ma ora non è più un fenomeno barbarico e la maggior parte delle “ruote” di cui abbiamo bisogno sono diventate popolari. Il livello di maturità delle unità di calcolo, dei sensori ecc. è molto più elevato rispetto agli anni precedenti. Sono disponibili innumerevoli piattaforme open source per la formazione parallela di modelli di grandi dimensioni e ci sono anche varie risorse informatiche sul cloud. La disponibilità sufficiente di "ruote" ci farà ripensare la struttura organizzativa.

Cinque anni fa pensavo che un'azienda come Midjourney, cioè un'azienda con 10 persone in grado di creare prodotti con milioni di utenti, sarebbe stata impossibile. Ma ora ci saranno sempre più aziende simili, con meno persone che si concentreranno su nucleo.

Jiazi Guangnian: Allora sarà facile come acquistare un computer host. Chi ti piacerebbe di più reclutare in questa situazione?

Hou Xiaodi: Ciò che desidero di più è reclutare veri credenti.

Jiazi Guangnian: come definire il vero credente?

Hou Xiaodi: La tecnologia è molto importante, ma la battaglia per il campionato e il secondo posto alle Olimpiadi di solito non è determinata dalla tecnologia. L’imprenditorialità è una corsa sulla lunga distanza, non uno sprint. Molte aziende che si guidano da sole muoiono per malattie acute, non croniche. Dovremmo garantire che l’azienda sia stabile e sopravviva a lungo. Per quanto riguarda un ingegnere, non è più così importante se risolve uno specifico problema di ingegneria in una settimana o in una settimana e mezza.

In secondo luogo, quando il capitale è molto abbondante, avrò una mentalità da spirito libero e sarò guidato in modo più inaspettato dall'individualismo. Un progetto hobbistico può ottenere grandi cose. Proprio come Google ha sempre affermato che Gmail è stato incubato dal loro sistema al 20%. Google una volta ha affermato che ogni ingegnere può dedicare liberamente il 20% del proprio tempo di lavoro).

Ma ora il costo per ottenere capitali è molto alto, la Federal Reserve non taglia i tassi di interesse e il finanziamento è molto difficile. Dobbiamo trasformarci a livello aziendale, dal basso verso l’alto verso il basso, da momenti individuali di brillantezza intellettuale a strategia aziendale organizzata. In questo caso, la libertà e il tempo concessi agli individui diventeranno sempre meno, il che è in realtà legato alla scarsità delle risorse.

Jiazi Guangnian: Questo è vero solo nel settore della guida autonoma o questa tendenza si applica all'intero campo tecnologico?

Hou Xiaodi: Penso che sia l’intero settore tecnologico. Alcune altre aziende che conosco non danno ai propri dipendenti molto spazio per esprimersi. Ad essere onesti, dobbiamo anche valutare in che misura l'ostentazione del sistema del 20% da parte di Google fosse solo pubblicitaria.

Jiazi Guangnian: Tuttavia, le aziende modello o i team stellari più popolari ora non sembrano avere molte persone. Hanno al massimo una dozzina di persone, con uno o due geni come leader del team, e hanno realizzato ottimi prodotti, come ad esempio Sora e Pika.

Hou Xiaodi: In effetti, ciò che la maggior parte delle persone nella maggior parte delle aziende ha fatto è stato uno o due passi oltre la tesi, soprattutto a livello del puro software. Alcuni dicono anche che sono tutti gusci modello Llama. Non sono d'accordo con affermazioni così estreme, ma in questo caso il lampo di abilità personale non ha portato cambiamenti sconvolgenti.

Jiazi Guangnian: Quindi speri che le persone che recluti possano implementare le idee presentate dall'azienda da cima a fondo.

Hou Xiaodi: Cinque anni fa avremmo aperto alcuni progetti speciali per soddisfare i dipendenti più famosi, ma ora non lo faccio. Il nostro valore fondamentale è se i costi operativi possono essere inferiori. Non si può dire che abbia pubblicato degli ottimi articoli, ma voglio fare un lavoro di ricerca di base e ho bisogno di un'atmosfera libera. Forse in passato le aziende avrebbero avuto lo stesso status gratuito delle istituzioni accademiche, ma negli ultimi anni non è stato così.

Jiazi Guangnian: Questo farà pensare ai candidati che sei troppo autoritario.

Hou Xiaodi: Se vuole la libertà nella ricerca, può scegliere il circolo accademico. Oppure dovrebbe trovare una grande azienda con capitale e già in monopolio. La nostra piccola azienda deve avere la mentalità di vivere sull'orlo della bancarotta. Anche se abbiamo appena raccolto fondi, dobbiamo sapere che i soldi verranno esauriti molto rapidamente. Con questa mentalità, non abbiamo davvero la libertà di aprire ricerca.

Inoltre, vorrei condividere un’idea di governance aziendale “dall’alto verso il basso”. Questo non ha nulla a che fare con la tecnologia, come utilizzare i professionisti.

Prendiamo come esempio gli avvocati. Gli avvocati sono divisi in due categorie, una è consulente legale aziendale e l'altra è avvocato specializzato in contenzioso. Gli affari legali aziendali spesso ti diranno che questo non è conforme e che è rischioso, ma se non incorpori questi suggerimenti nella strategia aziendale top-down, ma li accetti tutti, alla fine ci sarà ben poco che potrai fare. Gli avvocati specializzati in contenziosi combattono cause legali ogni giorno e vivono una vita leccando sangue, quindi non ti diranno cosa non si può fare. Diranno che ci sono dei rischi se lo fai, ma il rischio è maggiore se non lo fai , quindi devi ancora farlo. Un buon avvocato specializzato in contenziosi non ti fornirà avvisi sui rischi, ma ti fornirà direttamente una strategia generale dall’alto verso il basso.

Se ti affidi troppo ai "professionisti che fanno cose professionali" senza avere una propria spina dorsale strategica dall'alto verso il basso, entrerai facilmente in uno stato in cui non cerchi il merito, ma non cerchi i difetti. Ma le startup nuotano sempre controcorrente ed entrare in una situazione del genere è molto pericoloso e può portare alla morte. L'essenza della sopravvivenza di una piccola azienda è vedere se può creare miracoli nella direzione generale dell'azienda.

Jiazi Guangnian: Dall'essere il CTO di Tucson nei primi giorni al diventare il CEO, e ora avviare Bot.Auto, qual è la transizione più difficile?

Hou Xiaodi: Ora dobbiamo rafforzare i nostri studi in finanza, affari legali, finanziamenti e pubbliche relazioni. Pensavo che fosse sufficiente che i professionisti facessero cose professionali, ma ora penso di dover sviluppare una strategia di base per riunire tutti i livelli. Proprio come diversi musicisti che suonano strumenti diversi, alla fine ritornano tutti alla melodia principale di cui è responsabile il direttore d'orchestra. L'azienda ha bisogno di un leader di questo tipo, in grado di comprendere profondamente la visione e la missione dell'azienda e di consentire a tutte le parti di muoversi nella stessa direzione. Questo è il cambiamento che il CEO deve apportare.

Ora riesco a cogliere meno dettagli da solo. Se un problema algoritmico non può essere risolto fino a un mese dopo, prima potrei semplicemente sbattere il tavolo e andare in battaglia io stesso, ma ora questo non accadrà mai più. Se non riesci a finirlo, non lo farò io stesso. Ma dedicherò più tempo alla direzione generale e mi sincronizzerò con tutti su principi e strategie.

Jiazi Guangnian: Da quando hai avviato la tua attività ad oggi, ci sono stati altri cambiamenti negli obiettivi e nei principi in cui credi da tempo?

Hou Xiaodi: Vorrei iniziare con ciò che rimane invariato. Ho detto prima che ci sono tre ragioni per cui è necessaria la guida autonoma. In primo luogo, il mio lavoro deve essere significativo, in grado di migliorare la produttività ed essere stimolante; in secondo luogo, deve essere guidato dalla tecnologia, e la tecnologia apporta creazione di valore; terzo, il modello di business deve essere semplice e non posso dire di no nemmeno a me stesso Modello di business chiaro. Questi tre punti sono sempre gli stessi finché non faccio Bot.Auto adesso.

Quello che è cambiato è che in passato mi mettevo troppo in posizioni tecniche. Essere bravo equivale ad avere una bellezza che copre tutti i propri difetti. Ma ora voglio ancora trasformarmi in un guerriero esagonale e proteggere l’azienda in tutti gli aspetti. Per evitare di morire di una malattia acuta, dobbiamo riflettere attentamente su tutti gli aspetti. Allo stesso tempo, l'azienda ha bisogno di una strategia a lungo termine che possa muoversi in una direzione e utilizzare strategie per unire i dipendenti.

Nella mia precedente esperienza, ho ricoperto per la maggior parte del tempo il ruolo di CTO. Sentivo che l'azienda stava andando nella direzione sbagliata e diventai amministratore delegato, solo per rendermi conto che i problemi dei precedenti "Trent'anni di Wanli" erano stati difficili da superare. Poiché questa volta possiamo svolgere pienamente le funzioni di amministratore delegato fin dall'inizio, dobbiamo garantire che l'azienda sia sempre sulla strada strategica corretta fin dall'inizio.

*La signora A ha anche assistito all'intervista per questo articolo


Contatto per la cooperazione con i media ID WeChat |ciweimeijiejun

Se vuoi comunicare con noi puoi rispondere in background "unisciti al gruppo" per unirti alla community.