notizia

dialogo con l'ideale lang xianpeng: siamo già davanti a tesla

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

il ceo di tesla, elon musk, ha lanciato una trasmissione in diretta del software di guida intelligente di tesla fsd v12 nel 2023: la tesla nel video si basa sulla più recente tecnologia end-to-end e il software ha eliminato un gran numero di ingegneri il codice delle regole, utilizza invece il principale algoritmo della rete neurale. il veicolo si basa su visione autonoma e reti neurali per indicare dove rallentare, identificare i semafori e gli eventuali attori sulla strada e prendere decisioni autonome.

questa tecnologia ha successivamente suscitato grandi discussioni e interesse da parte dell’industria, degli appassionati di tecnologia e persino dei normali consumatori di automobili.

si tratta di un nuovo ciclo di recupero del paradigma per la guida intelligente. ad oggi, sono ancora molte le opinioni che emergono nel mercato cinese:

l’emergere della tecnologia end-to-end ha livellato la linea di partenza per molte aziende automobilistiche impegnate nella guida intelligente. tutti sono ora di nuovo al punto di partenza, iniziando una corsa a lunga distanza nei dati e nella potenza di calcolo.

la tecnologia end-to-end è influenzata da dati forti. la costruzione di modelli e la quantità di acquisizione dei dati, in particolare l’acquisizione di dati di qualità effettiva, influenzano la rapida iterazione della tecnologia.

nel mercato cinese, le case automobilistiche indipendenti con il "vantaggio sul campo di casa" hanno intrapreso un'altra corsa a lunga distanza per la guida intelligente. allo stesso tempo, ci sono molte opinioni secondo cui il vantaggio di tesla sull'fsd verrà spazzato via in questa fase.

anche il dottor lang xianpeng, vicepresidente della ricerca e sviluppo sulla guida intelligente di li auto, ritiene che,in termini di architettura tecnica, l’ultima soluzione di ideal non è molto diversa da quella di tesla, ed è anche leggermente più avanti. poiché idealmente ha un modello vlm e un sistema 2, tesla ha solo il sistema 1 end-to-end.

il modello end-to-end di li auto è one model integrato end-to-end, che è leggermente diverso dall'end-to-end di altre case automobilistiche sul mercato.

la tecnologia end-to-end convenzionale utilizza solo modelli di intelligenza artificiale e autoapprendimento meccanico per sostituire i moduli di percezione, pianificazione e controllo nel processo di guida intelligente, dall'"input" visivo al sistema di guida intelligente e al controllo finale del veicolo il lato "output" della guida è completamente gestito dal modello. una pura tecnologia "end-to-end" non fissa più codici basati su regole in questo processo e diventa una scatola nera completa.

tuttavia, molte aziende automobilistiche sul mercato, compresi produttori relativamente avanzati come tesla, huawei e xpeng, impostano ancora determinati algoritmi sottostanti responsabili della ridondanza della sicurezza. la percezione e il controllo della pianificazione possono essere moduli relativamente indipendenti e le interfacce devono ancora essere definite e collegate manualmente.

il modello one integrato end-to-end ha lo scopo di mettere insieme i moduli di controllo della percezione e della pianificazione. è idealmente chiamato sistema 1 internamente ed è più simile a un driver per eseguire rapidamente decisioni end-to-end.

in passato, le applicazioni end-to-end nel campo della guida intelligente spesso incontravano il problema del limite superiore elevato ma anche del limite inferiore inferiore. ad esempio, tesla, il leader del settore, ha effettuato test senza problemi in california, negli stati uniti, e si è comportato in modo molto simile a un guidatore umano. tuttavia, una volta entrata in un’area sconosciuta, dovrà prendere decisioni normative difficili da spiegare.

questo è uno degli svantaggi dell'end-to-end.

l’approccio ideale è introdurre il sistema 2, il modello del linguaggio visivo vlm, e fare un altro passo avanti.

idealmente, il modello del linguaggio visivo vlm è il primo grande modello al mondo implementato con successo su un chip lato automobile e ha la capacità di gestire il pensiero logico e il processo decisionale in scenari complessi.

oltre a one model end-to-end, system 2 - vlm è un altro insieme di algoritmi modello che assistono il sistema 1 nella pianificazione e nel processo decisionale. il sistema 2 basato su vlm può fornire la capacità di comprendere ambienti complessi, la capacità di leggere le mappe di navigazione e la capacità di comprendere le regole del traffico.

lang xianpeng ha dato a questa combinazione una spiegazione più popolare: il sistema 1 è come un autista e il sistema 2 è un istruttore di scuola guida. il sistema 1 si affida interamente alla propria percezione visiva per eseguire le operazioni, il sistema 2 ha bisogno di accumulare conoscenze per un lungo periodo di tempo per ricordare e informare il sistema 1.

zhan kun, esperto di algoritmi avanzati per la guida intelligente di li auto, e il suo team sono stati i primi a proporre questo concetto. seguendo l'esempio di daniel kahneman, psicologo cognitivo e vincitore del premio nobel, ritiene che il cervello umano abbia due sistemi. il primo sistema si basa sull'esperienza e sull'intuizione, mentre il secondo apprende e accumula conoscenza in modo completo.

i due sistemi servono l'intera guida intelligente ideale, il che rende anche la soluzione di guida intelligente ideale completamente diversa da quella di altre case automobilistiche.

nel mercato statunitense, tesla fsd è leader in termini di potenza di calcolo e dati.

ma nel mercato cinese la strategia ideale sembra essere quella di ricreare una “china tesla smart driving road” per posizionarsi più avanti.

lang xianpeng ha detto: "in termini di potenza di calcolo e dati di formazione della cina, riteniamo che almeno da ora in poi saremo davanti a tesla, perché tesla è ancora soggetta ad alcuni vincoli in cina in termini di conformità dei dati e potenza di calcolo di formazione essere costruito in cina.

ideal introduce anche un sistema modello mondiale nel processo di test dei dati.

ideal ha affermato che il modello mondiale supporta l'iterazione su larga scala e ad alta velocità di una nuova generazione di guida intelligente ideal, fornisce un sistema automatizzato di valutazione delle capacità di intelligenza artificiale, utilizza la tecnologia di ricostruzione per trasformare gli scenari problematici incontrati dagli utenti in "serie di domande sbagliate" e utilizza la tecnologia di generazione per trasformare gli utenti in "serie di domande sbagliate". le scene di guida reali vengono utilizzate come "domande di simulazione". le due tecnologie garantiscono che le domande sbagliate non vengano più poste in modo errato durante la valutazione del modello e hanno anche eccellenti capacità di generalizzazione .

basato sulla soluzione tecnica di ideal one model+vlm+world model, questo porta anche una nuova generazione di prodotti di guida intelligente ideal in una nuova fase di "guida autonoma supervisionata".

ideal è la prima azienda a implementare vlm su chip orin-x e la prima azienda automobilistica ad adottare un'architettura a doppio sistema. in cina, ideal ha già un volume di vendite vicino al milione, il che inevitabilmente aumenterà la percentuale di dati effettivi. l'attuale chilometraggio di addestramento accumulato di li auto ha superato i 2,2 miliardi di chilometri e si prevede che supererà i 3 miliardi di chilometri entro la fine del 2024. l'attuale potenza di calcolo dell'allenamento di li auto ha raggiunto 5,39 eflops e si prevede che supererà 8 eflops entro la fine del 2024.

tuttavia, l'industria è ancora in disaccordo sull'applicazione e sulle prospettive della tecnologia end-to-end: alcuni pensano che non sarà possibile raggiungere una guida intelligente senza 50 miliardi, mentre altri credono che, almeno nei prossimi anni, la tecnologia end-to-end gli algoritmi del modello basato su regole e le funzioni del singolo modulo saranno ancora paralleli, il puro end-to-end è ancora una cazzata.

in una certa misura, i risultati dei test dell’ideal user experience group hanno verificato l’attuale razionalità di questo percorso. in ogni caso, li auto ha preso l'iniziativa di compiere questo passo.

dr. lang xianpeng, vicepresidente della ricerca e sviluppo sulla guida intelligente di li auto, e zhan kun, esperto senior di algoritmi di li auto intelligent driving

quella che segue è la sintesi dello scambio con il dr. lang xianpeng, vicepresidente della ricerca e sviluppo sulla guida intelligente di li auto, e zhan kun, esperto senior di algoritmi di li auto intelligent driving. la conversazione è stata modificata senza modificare il significato originale:

domanda: tutti nel mercato dicono che sono end-to-end. qual è il vero end-to-end?

zhan kun:end-to-end è un paradigma di ricerca e sviluppo. come suggerisce il nome, si riferisce all'esecuzione di un'attività dall'input iniziale all'output finale. non viene utilizzato alcun altro processo nel mezzo processo dall'input all'output. questo è end-to-end il significato essenziale di end-to-end, purché soddisfi questo significato, possiamo chiamarlo end-to-end.

ora l'auto ideale è un modello one integrato end-to-end attraverso l'input diretto del sensore, una volta completata l'inferenza del modello, la pianificazione della traiettoria viene utilizzata direttamente per controllare l'auto altri passaggi intermedi. esiste anche un metodo end-to-end, che consiste nel dividere due modelli a metà. un segnale viene utilizzato come ponte tra i modelli. l'input è un modello di percezione. i risultati della percezione vengono quindi immessi nel modello di controllo. e sono combinati in un modello end-to-end modulare. end-to-end, questo può anche essere chiamato end-to-end, ma crediamo che tale end-to-end non sia veramente end-to-end. . lo stesso end-to-end di li auto vuole risolvere la perdita di informazioni intermedie. se nel mezzo viene aggiunto un processo di digestione artificiale delle informazioni, l'efficienza potrebbe non essere così elevata o il limite superiore delle capacità potrebbe essere limitato che l'end-to-end integrato è l'end-to-end più essenziale.

domanda: ci ispiriamo a tesla? ci sono differenze rispetto ai tradizionali moduli end-to-end?

zhan kun:tesla ha menzionato l’end-to-end all’inizio del 2023 e musk ha affermato su twitter che incarna un modello completo di controllo diretto dell’auto dall’input all’output. tutti sono rimasti scioccati quando hanno visto questa notizia, perché non si sono limitati a proporre questa cosa. nel 2016, nvidia aveva un modello che menzionava l'end-to-end e ha pubblicato un articolo, ma l'effetto è stato nella media e ha solo risolto il problema. in uno scenario particolarmente semplice, data la potenza di calcolo e la scala del modello dell’epoca, tutti pensavano che questa strada fosse irrealizzabile.

entro il 2023, alla nuova architettura del trasformatore verrà aggiunta una potenza di calcolo estremamente elevata. dopo che tesla la avrà costruita, potrebbe verificarsi la rinascita di un nuovo paradigma. l’end-to-end non è la prima cosa che tesla ha proposto, ma sta avanzando in una direzione di maggiore crescita. dopo aver visto questo, stiamo pensando anche internamente. rispetto al precedente modello modulare, l'approccio end-to-end è più essenziale per ridurre la ridondanza delle varie informazioni. sul modello senza grafico, siamo vicini al modello end-to-end modulare. abbiamo un modello percettivo di grandi dimensioni, che in realtà è un modello end-to-end modulare. anche così, abbiamo scoperto che il modello end-to-end necessita ancora di regole e che ci sono ancora dati divisi in moduli e attività politiche divise in moduli.

questa volta, nella nostra discussione e nella concezione di nuove soluzioni, abbiamo proposto che la soluzione end-to-end debba essere più approfondita ed essenziale. li auto dispone di dati molto ricchi e crediamo che questi dati possano supportarci nel fare un buon lavoro. questo è il nostro vantaggio. quindi abbiamo scelto un'architettura integrata end-to-end che è più impegnativa e difficile. il suo limite superiore è molto alto, ma lo svantaggio è che è più difficile addestrare il modulo del punteggio, incluso il rapporto dati e i metodi di addestramento abbiamo molto know-how da esplorare e scavare, ma abbiamo comunque scelto con risolutezza la strada difficile ma corretta.

domanda: molti marchi ora affermano di essere leader e li auto afferma anche di essere entrata nel primo livello della guida intelligente. come valutare il livello tecnico end-to-end di queste aziende sul mercato?

lang xianpeng:da un punto di vista tecnico, ai consumatori ordinari non interessa se ci sono immagini o nessuna immagine, end-to-end o non-end-to-end ciò su cui tutti alla fine si concentrano è il prodotto e l'esperienza di utilizzo esso, così come il valore del prodotto. pertanto, non stiamo cercando di competere con nessuno, ma speriamo di fornire prodotti e servizi migliori ai nostri utenti. in passato, la noa ad alta velocità veniva utilizzata con mappe ad alta precisione e l'esperienza della noa ad alta velocità soddisfaceva le esigenze degli utenti. successivamente, abbiamo provato molti metodi nel processo di creazione della noa della città. una delle idee molto semplici era quella di utilizzare le mappe per creare la noa della città. tuttavia, abbiamo scoperto che non esisteva alcun rivenditore di mappe in grado di fornire mappe ad alta precisione della città. fornire immagini luminose. ma crediamo che i grafici leggeri non siano fattibili, perché una volta che sono necessari grafici iterativi, sorgono problemi di tempestività e se possano effettivamente essere utilizzati. non possiamo lasciare che gli utenti abbiano la sensazione che un posto disponibile oggi non lo sarà domani.

alla fine, abbiamo deciso di farlo senza immagini. la precedente soluzione senza immagini si basava su soluzioni di percezione, pianificazione e sottomoduli, che includevano un gran numero di regole manuali e test effettivi del veicolo. per non parlare dell'investimento in termini di budget, era molto difficile in termini di tempo. quando il modello verrà ripetuto, se si desidera affrontare varie condizioni durante tutto l'anno, non sarà possibile entro uno o due anni e gli utenti non possono aspettare così a lungo. quindi abbiamo ripetuto l'architettura tecnica end-to-end + vlm. penso che questa soluzione tecnica sia essenzialmente una soluzione di intelligenza artificiale. non è stata progettata, ma è cresciuta da sola.

inoltre, oggi vi ho presentato il contenuto del modello mondiale. a mio avviso, questa capacità è la garanzia più importante e necessaria per ottenere una rapida iterazione della guida autonoma.un'iterazione del modello richiederebbe una grande quantità di veicoli, persone e tempo per essere testata in modo tradizionale, ma ora utilizziamo la tecnologia di generazione e ricostruzione per raccogliere le scene in cui si sono verificati problemi in passato e costruire una libreria di scenari di scena errati.prima di ogni rilascio, sono stati fatti più di 10 milioni di chilometri di test su semplici domande sbagliate, e questo è un insieme efficace di domande sbagliate, non un test su strada casuale. inoltre, possiamo anche generare scenari e simulare scenari, che sono anche decine di milioni di test di scenario. l'iterazione del modello in questo modo è ora molto più affidabile del metodo originale di prova del veicolo o su strada e può coprire vari scenari durante tutto l'anno. questo è il nostro approccio. non sappiamo se altri marchi lo facciano, ma ci basiamo completamente sulle esigenze degli utenti. lavoriamo sulla tecnologia, non per il bene della tecnologia, ma perché questa tecnologia può davvero risolvere le esigenze degli utenti e offrire un'esperienza di prodotto migliore, quindi lo faremo.

domanda: non molto tempo fa qualcuno ha avanzato l'idea che "è impossibile fare una guida intelligente senza 50 miliardi".

lang xianpeng:per quanto riguarda 50 miliardi, bisogna valutare se si tratta di un investimento una tantum o di un investimento a lungo termine. come accennato oggi, investiamo 1 miliardo di dollari ogni anno in ricerca e sviluppo sulla guida intelligente. supererà i 50 miliardi.

l'architettura tecnica end-to-end + vlm rappresenta uno spartiacque.prima utilizzavamo ancora metodi tradizionali per la guida autonoma. a partire da questa generazione, utilizzeremo veramente l’intelligenza artificiale per la guida autonoma. successivamente, nella ricerca e nello sviluppo della guida autonoma, la competizione principale è se ci sono più e migliori dati e la potenza di calcolo adeguata per addestrare il modello. l’acquisizione di potenza di calcolo e dati dipende da quanti soldi vengono spesi e da quante risorse vengono investite. alcune di queste cose non possono essere acquistate con denaro, come i dati di allenamento e il chilometraggio di allenamento. ogni azienda automobilistica ha i propri dati e non li condivide tra loro.

un’altra cosa che richiede investimenti è la potenza di calcolo.si prevede che la nostra attuale potenza di calcolo di 539 milioni di eflops raggiungerà gli 800 milioni di eflops entro la fine di quest'anno. non si tratta più di 1 miliardo di yuan, ma di un costo di 2 miliardi di yuan, che consumerà 2 miliardi di yuan all'anno. quando in futuro si entrerà nella fase l4, la crescita annuale dei dati e della potenza di calcolo sarà esponenziale, il che significa che sarà necessario almeno 1 miliardo di dollari usa (da sei a sette miliardi di yuan) ogni anno. e dopo 5 anni, bisognerà continuare a ripetere. a questo livello, sarà molto difficile se i profitti e i profitti di un'azienda non riusciranno a sostenere l'investimento. pertanto ora non dobbiamo prestare attenzione a quanti miliardi vengono investiti nella guida autonoma, ma partiamo dall’essenza e vediamo se c’è sufficiente potenza di calcolo e supporto dati, e poi guardiamo quanti soldi devono essere investiti. .

domanda: come garantire la sicurezza del modello quando la quantità di dati non è molto grande? da un punto di vista concettuale siamo ora anche noi una sorta di "due modelli"?

lang xianpeng:la "sicurezza" è una questione che ha attirato molta attenzione, se ci sono problemi di coordinamento, se esistono moduli di sicurezza indipendenti, ecc. il motivo per cui tutti hanno questi problemi è perché tutti pensano dal punto di vista della ricerca e dello sviluppo del passato sulla guida autonoma senza intelligenza artificiale. io per esempio andavo a cavallo. mi chiedeva se c'era una sella sulla macchina. è perché non tutti hanno veramente capito cosa sono le pratiche di intelligenza artificiale e quali sono le pratiche non di intelligenza artificiale. questo è il primo punto.

in secondo luogo, molte persone ora affermano di avere un modello end-to-end, ma il vero modello end-to-end dipende ancora da due capacità: se ci sono abbastanza dati e se c’è sufficiente potenza di calcolo. altrimenti penso che sarà difficile raggiungere un vero end-to-end, perché l’end-to-end è un approccio basato sull’intelligenza artificiale.

in terzo luogo, i limiti superiore e inferiore delle capacità end-to-end sono molto elevati. vorrei fare un'analogia. prima che uscisse la cnn (modello di rete neurale profonda), tutti utilizzavano ancora i metodi tradizionali di apprendimento automatico per svolgere alcune attività, come le attività di classificazione delle immagini con cui abbiamo familiarità. a quel tempo, gli algoritmi svm incontravano colli di bottiglia. ma non appena è uscita la cnn, sono stati sopraffatti dal miglioramento del 10%+. ciò che voglio esprimere è che non tutti hanno veramente compreso le funzionalità end-to-end e non avremo fretta di spingerle agli utenti beta interni.

quando utilizziamo metodi non basati sull'intelligenza artificiale, dobbiamo considerare molti scenari in termini di dettagli di controllo verticale. in questo modo, quando progettiamo le regole della scena, dobbiamo impostare molte condizioni per stabilire quali azioni devono essere intraprese in determinate circostanze. condizioni. ma quando è stata addestrata la nostra prima versione del modello end-to-end, ho scoperto che sarebbe stata molto comoda ad ogni incrocio o in condizioni che richiedevano controllo longitudinale. non abbiamo eseguito il debug per situazioni speciali, è stata la capacità del modello ad addestrarsi da solo. si può constatare che abbiamo un grosso problema quando stabiliamo le regole perché gli scenari sono troppo diversi ed è impossibile per noi stabilire regole per tutti gli scenari. ma quando usiamo l'intelligenza artificiale per costruire un modello end-to-end, scopriremo che ha questo potere magico. quando gli forniamo i dati, può davvero apprendere l'esperienza di guida di queste persone. non solo può apprendere il limite massimo , ma può anche migliorare significativamente il modello. il limite inferiore di miglioramento. sebbene abbia ancora i suoi limiti, il modo in cui lo risolviamo non è più stabilire regole, ma fornire dati più e migliori.

allo stesso modo, abbiamo anche una strategia semplice sul modulo di controllo. perché l'input del nostro sensore end-to-end viene inviato all'output della traiettoria e l'output della traiettoria viene fornito ai moduli di sterzo e frenatura. qui abbiamo una politica di sicurezza. ad esempio, se prevede di effettuare una brusca virata di 180°. i vincoli saranno implementati, ma ci sono pochissime regole simili che possono essere ignorate rispetto all'approccio precedente.

allo stesso tempo, abbiamo migliorato i profitti della sicurezza e il limite superiore delle capacità. il nostro approccio è quello di fornire continuamente dati di alta qualità e imparerà sicuramente molte abitudini di guida sicure.

domanda: come garantire che i dati end-to-end + vlm siano puliti?

zhan kun:sia che si tratti di soluzioni end-to-end o vlm, i dati sono la cosa più importante e i modelli di grandi dimensioni hanno sempre enfatizzato i dati di alta qualità.quindi il nostro primo passo è pulire le origini dati.la nostra selezione dei dati di guida è molto rigorosa. abbiamo un punteggio interno per ciascun proprietario dell'auto, che comprende varie dimensioni ed è ponderato, ad esempio se c'è una violazione di guida, se la linea è stata premuta a lungo, se lo stop. la linea è stata parcheggiata e se il processo di guida è il 3% migliore degli utenti verrà selezionato come "guidatori esperti" in base ai punteggi dati da vari indicatori come quando si gira il volante in modo medio o urgente o si avverte disagio. nel caso di dati ideali su larga scala, anche il primo 3% è una quantità di dati molto elevata. può comunque garantire che i dati che otteniamo siano molto buoni. almeno il comportamento di guida è standardizzato, confortevole e ragionevole se i dati vengono forniti end-to-end.

c'è anche uno screening al secondo livello. durante il processo di formazione del modello, dobbiamo anche abbinare e classificare i campioni del modello in alcuni scenari. esistono molti scenari estremi e difficili e ci saranno modelli di valutazione, metodi di valutazione e alcune regole può pulire i dati e classificare ogni tipo di dati in tag molto dettagliati.

nell'ultimo livello, sapremo quali campioni sono difficili da apprendere durante il processo di formazione e adatteremo la strategia di apprendimento, inclusa la costruzione deliberata di alcuni dati sintetici per l'apprendimento di rinforzo e l'apprendimento contrastivo. apporta alcune modifiche ai metodi di apprendimento per i nostri dati, in modo che tutti i nostri dati end-to-end e i dati vlm siano ben verificati e puliti e il modello risultante sia migliore. questo processo non avviene da un giorno all'altro.

lang xianpeng:c’è un altro problema, il problema dei dati sporchi. il nostro volume di dati per l'addestramento è ancora relativamente ampio, anche se in seguito avremo dati sporchi molto piccoli, poiché l'addestramento delle abilità dell'ia non ha una macchia che possa inquinare l'intero effetto, quindi finché la quantità di dati accurati è abbastanza grande, esiste. ci sarà una piccola interferenza. anche i dati non contano molto.

domanda: negli ultimi anni, la battaglia tecnologica della guida intelligente è cambiata rapidamente e ha attraversato diverse importanti iterazioni. end-to-end + vlm saranno un quadro con vitalità a lungo termine?

lang xianpeng:end-to-end + vlm è un'architettura che simula il pensiero e la cognizione umana, perché quando realizziamo l'intelligenza artificiale, alla fine speriamo di ottenere l'antropomorfismo o la somiglianza umana. sono stato molto ispirato dopo aver letto il libro "thinking, fast and slow" e alla fine volevo sapere come le persone fanno cognizione e pensiero. pensiamo che l'attuale quadro dell'intelligenza artificiale sia molto ragionevole e siamo anche molto lieti di vederlo dopo l’abbiamo proposta, molte aziende del settore hanno iniziato a menzionare i vantaggi della teoria del doppio sistema e stanno cercando di dare seguito. inoltre, la teoria del doppio sistema non può essere utilizzata solo nella guida autonoma, ma è anche un paradigma per la futura intelligenza artificiale e persino per i robot intelligenti. si può dire che la guida autonoma sia un robot intelligente su ruote, ma il suo ambito di lavoro è la strada. pertanto, penso che abbia alcune capacità a lungo termine, ma lo sviluppo tecnologico è infinito. manterremo un'acuta consapevolezza delle tecnologie avanzate e, se ci saranno nuove tecnologie, le seguiremo.

domanda: ideal attualmente ritiene che ci sia un grande divario tra me e la guida intelligente di tesla, e quando sarò in grado di recuperare il ritardo?

lang xianpeng:l'anno scorso ho risposto che era meno di sei mesi e quest'anno potrebbe essere un po' meno. innanzitutto, in termini di architettura tecnica, non siamo molto diversi da tesla, e siamo anche un po’ più avanti, perché abbiamo vlm e system 2, mentre tesla ha solo system 1, end-to-end. in secondo luogo, in termini di potenza di calcolo e dati di formazione della cina, riteniamo che almeno da ora in poi saremo davanti a tesla, perché tesla è ancora soggetta ad alcuni vincoli in cina in termini di conformità dei dati, nonché di formazione. della potenza di calcolo deve ancora essere stabilita in cina. da questo punto di vista, il divario tra noi in cina e tesla potrebbe non essere così grande. ci auguriamo inoltre che tesla possa unirsi, imparare gli uni dagli altri e concentrarsi sul miglioramento di se stessi.

domanda: si ritiene che il percorso dell'intelligenza artificiale per la guida intelligente non sia del tutto corretto, e non penso che questo percorso possa funzionare, perché l2 presta maggiore attenzione al basso costo o alla versatilità, ma l4 può raggiungere l'universalità solo dopo la sicurezza è risolta, quindi la produzione di massa l'auto può essere l4?

lang xianpeng:primo,crediamo che tutto debba partire dalle esigenze e dal valore dell’utente.qualsiasi prodotto realizzato da li auto deve superare o soddisfare il valore dell'utente. lo realizziamo solo se gli utenti lo trovano prezioso. riteniamo che gli utenti debbano avere una domanda per la guida autonoma, quindi è impossibile per noi progettare che gli utenti possano guidare solo la l4 a chengdu e non altrove.

in secondo luogo, il percorso tecnico progressivo o balzo in avanti consente a ciascun marchio di discutere e scegliere il proprio percorso tecnico.ma li auto sceglierà sicuramente un percorso tecnico che soddisfi le esigenze degli utenti.ora scegliamo di utilizzare l’intelligenza artificiale per la guida autonoma. precedentemente chiamato guida assistita, il sistema aiutava le persone a guidare e l’argomento erano le persone. ma dopo la fase end-to-end + vlm, crediamo che l'auto si guiderà da sola. dopo aver addestrato un modello completo, il modello sarà in grado di guidare bene l'auto. supervisionerò i casi in cui l'auto non funziona o se ci sono indicazioni che debbano essere prese in consegna. tuttavia, il soggetto deve essere l'auto e le persone servirà come ruolo ausiliario nella supervisione. se raggiungerà questo livello, soddisferà la richiesta degli utenti di guida autonoma.

domanda: li auto ha in programma di addebitare costi per la guida intelligente di fascia alta?

lang xianpeng:standard e gratuita sono entrambe le strategie che ideal ha formulato fin dal primo giorno di guida intelligente. la “guida autonoma supervisionata” è gratuita per tutti i possessori di ad max. il volume delle consegne è relativamente buono e le operazioni dell'azienda sono stabili, inoltre dispone di risorse sufficienti per investire nella ricerca e nello sviluppo della guida intelligente. il volume delle consegne è un parametro molto importante per noi, non si tratta solo del volume delle consegne, ma può anche fornire più chilometri di addestramento del veicolo per la guida autonoma.