notizia

spendere 1 miliardo all’anno è solo l’inizio. le “mitiche” “migliori pratiche” end-to-end nel circolo della guida autonoma cinese possono generare profitti?

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autore|hua wei

si prevede che in meno di sei mesitesla fsd entrerà ufficialmente in cina. il 5 settembre tesla ha annunciato che fsd sarà lanciato in cina e in europa nel primo trimestre del 2025.

non molto tempo fa, la versione end-to-end tesla fsd v12 ha ricevuto molti elogi dal settore e non solo dopo il suo lancio. anche chi ha più volte “litigato” apertamente con teslamotori xpengil presidente he xiaopeng ha anche pubblicato un messaggio in cui commenta che la guida autonoma di tesla “ha funzionato estremamente bene” e ha affermato con entusiasmo che “il 2025 sarà il momento chatgpt per la guida completamente autonoma!”

i grandi modelli rappresentati da gpt stanno influenzando profondamente il modello di ricerca e sviluppo del programma nel campo della guida autonoma con la loro velocità di innovazione e architettura tecnica senza precedenti, e l’industria globale sta rispondendo rapidamente a questa mania. a giudicare dall’attuale focus delle case automobilistiche nazionali, l’end-to-end è diventato anche il loro percorso tecnologico di guida autonoma di prossima generazione.

le aziende di guida autonoma di autovetture come huawei, xpeng, pony.ai, momenta, jiji technology e horizon stanno attivamente seguendo l'esempio e hanno lanciato soluzioni e modelli di guida autonoma end-to-end per la produzione di massa. in termini di veicoli commerciali, zero one automobile ha anche annunciato un chiaro piano temporale per il lancio del modello di grandi dimensioni end-to-end sul veicolo.macchina idealeil fondatore e ceo li xiang ha anche affermato pubblicamente che li auto raggiungerà la guida autonoma l4 entro tre anni basandosi su modelli end-to-end e mondiali.

anche il mercato della guida autonoma l4, che in precedenza aveva subito una “ondata di freddo”, si è ripreso grazie all’arrivo della tecnologia end-to-end. wayve, che ha fatto affidamento su questo concetto tecnico per ottenere un finanziamento di 1 miliardo di dollari, è un ottimo esempio. liu yudong, gestore degli investimenti di chentao capital, ha dichiarato: “l’approccio end-to-end apre la seconda curva di crescita per la commercializzazione di l4”.

tesla, che ha fatto un balzo in avanti nelle capacità fsd con funzionalità end-to-end, ha anche annunciato che lancerà il modello robotaxi il 10 ottobre. he xiaopeng ha anche rivelato pubblicamente che xpeng motors lancerà robotaxi nel 2026. tuttavia, le recenti azioni e aspettative delle case automobilistiche e dei produttori di guida autonoma per raggiungere la produzione di massa della l4 attraverso soluzioni end-to-end hanno portato molti professionisti della guida autonoma a chiedersi: la modalità end-to-end è stata eccessivamente "mitizzata"?

perché l'end-to-end diventa la "classe superiore" nel circolo della guida intelligente?

l’end-to-end non è emerso solo negli ultimi due anni. già nel 2017 molte aziende stavano esplorando la possibilità di questo percorso tecnico. quest'anno "end-to-end" è diventato popolare nel circolo della guida autonoma ed è considerata una tecnologia killer nel settore. oltre alle innovazioni portate da grandi modelli linguistici come chatgpt, è anche inseparabile dalla propria ". fascino".

"la nascita del modello end-to-end è l'unico modo per la tecnologia di guida autonoma di portare alla commercializzazione su larga scala." lou tiancheng, co-fondatore e chief technology officer di pony.ai, ha affermato che questo è uno dei maggiori vantaggi il punto fondamentale del modello end-to-end è che può generalizzabilità aumentare la velocità di commercializzazione della guida autonoma e accelerarne la divulgazione.

secondo wang panqu, responsabile della guida intelligente presso zero one automobile, i tradizionali sistemi di guida autonoma non end-to-end non solo hanno una generalizzazione inferiore rispetto all'end-to-end, ma anche quando si espandono a nuovi scenari, molte regole precedentemente utilizzate- se fallisce, il codice appena aggiunto peggiorerà la manutenibilità del sistema, il che porterà ad un aumento dei costi marginali.

inoltre, i tradizionali sistemi di guida autonoma presentano anche due svantaggi. il primo è la complessità dell'architettura. non solo il costo di sviluppo di un sistema multi-modulo è più elevato, poiché a ciascun modulo vengono assegnate meno risorse di elaborazione, ma anche il suo limite superiore di prestazioni è relativamente basso e anche la comunicazione tra i moduli ne porterà molte. problemi di ingegneria. il secondo è il problema dei costi elevati causato dalla complessa architettura. ogni modulo richiede sviluppo, manutenzione, gestione del progetto e integrazione. questo è anche il motivo per cui le dimensioni del team delle tradizionali aziende di guida autonoma sono molto grandi.

"secondo me, l'end-to-end può risolvere molto bene questi problemi." wang panqu ha affermato che da un punto di vista architettonico, l'end-to-end ha un solo modulo, che può risolvere bene problemi architettonici complessi e ha anche il capacità di ridurre i costi e aumentare l’efficienza. la generalizzazione end-to-end guidata dai dati e persino dalla conoscenza è molto forte ed è probabile che venga rapidamente implementata nella produzione di massa. non solo può ridurre il costo dell’adattamento di l2 a vari modelli, ma aiuta anche l4 a ridurre i tempi di adattamento a diversi scenari.

inoltre, lou tiancheng ha sottolineato che il più grande vantaggio dell'end-to-end è prevenire la perdita di informazioni tra diversi moduli e funzioni. anche mao jiming, vicepresidente dell'ingegneria presso jiji technology, ha parlato di questo aspetto e ha spiegato che la trasmissione efficace delle informazioni tra i moduli implica il problema della trasmissione efficace delle informazioni. le interfacce dei moduli a monte e a valle definiscono il limite superiore della trasmissione delle informazioni. ma non importa quanto sofisticato sia il design dell'interfaccia, ci sarà una perdita di informazioni. la soluzione del modulo unificato end-to-end non soffre di questa perdita di informazioni, il che aiuta a migliorare l'effetto finale dell'algoritmo.

allo stesso tempo, mao jiming ha parlato anche degli altri vantaggi dell'architettura end-to-end. innanzitutto, in termini di errori del modulo, poiché l'end-to-end è sotto un modulo, non vi è alcun effetto di amplificazione dell'errore di più moduli e il limite superiore delle capacità complessive dell'algoritmo di guida intelligente può essere massimizzato. in secondo luogo, nell’architettura multi-modulo, ciascun modulo ha il proprio ritmo di ricerca e sviluppo e obiettivi di ottimizzazione, che non sempre possono essere strettamente allineati con gli obiettivi di ottimizzazione globale dell’intero sistema di guida intelligente, con conseguente ottimizzazione potenzialmente inefficace e investimenti sprecati in risorse di ricerca e sviluppo; mentre il terminale l'architettura end-to-end ha un solo modulo e gli obiettivi di ottimizzazione sono chiari e unificati, il che può effettivamente evitare questo tipo di processo di ottimizzazione interna.

un altro punto è che i componenti dell'architettura modulare formano naturalmente facilmente più "domini" guidati da regole, il che comporta una serie di sfide di manutenzione e dilemmi di risoluzione dei casi limite e end-to-end, come una tipica architettura completamente basata sui dati; spingerà gli sviluppatori a essere più proattivi e a iniziare a considerare e risolvere i problemi partendo da un paradigma di pensiero basato sui dati e sui modelli, migliorando il livello cognitivo dell'intero team dell'algoritmo.

"nel complesso, l'efficienza dello sviluppo del sistema end-to-end è maggiore e il consumo di risorse è inferiore." liu yudong ha affermato che il paradigma di sviluppo end-to-end basato esclusivamente sui dati ridurrà notevolmente l'investimento iniziale risorse tecniche e spostare l'attenzione sulle risorse dell'azienda. passaggio ad un'elevata densità di talenti negli aspetti basati sui dati e investimenti nell'accumulo di dati.

vale la pena ricordare che anche il valore per l'utente apportato dall'end-to-end ha attirato molta attenzione. liu yudong ha sottolineato che, in primo luogo, in termini di elaborazione di scenari a coda lunga, il sistema end-to-end può coprire scenari più estremi rispetto al sistema originale, come le capacità di elaborazione del buon senso. in secondo luogo, il comportamento del sistema di guida autonoma è più antropomorfico e può anche creare una maggiore fiducia tra i consumatori e il sistema end-to-end, è più simile a un guidatore umano in uno scenario con un forte gameplay.

il limite superiore è alto e quello inferiore è basso. la “fine” della guida autonoma è già finita?

sebbene i vantaggi tecnici end-to-end siano significativi e molte case automobilistiche e aziende di guida autonoma stiano attivamente sviluppando applicazioni end-to-end, ci sono ancora opinioni divergenti nel settore riguardo al cosiddetto "modello end-to-end" ."

sostenitori come wang panqu hanno affermato: "credo che l'end-to-end debba essere la forma finale per realizzare la guida autonoma, ma l'end-to-end è solo un quadro tecnico, ma in realtà ci sono molte opzioni per metodi di implementazione specifici, e l'industria non ha ancora raggiunto un consenso."

razionalisti come mao jiming hanno sottolineato che la soluzione end-to-end ha le caratteristiche di "limite superiore alto ma limite inferiore basso". in parole povere, se fatto bene, si possono ottenere buoni risultati, ma se fatto male, sarà peggiore delle soluzioni tradizionali. secondo mao jiming, la scelta di una soluzione end-to-end dipende dallo scenario applicativo specifico. per la guida autonoma l5 l’end-to-end è l’unica soluzione, ma per l2 e l3 l’end-to-end è solo una delle soluzioni fattibili. inoltre, l’applicazione end-to-end deve essere combinata con altre soluzioni tecniche.

"l'end-to-end fornisce un buon percorso tecnico per la divulgazione rapida e su larga scala della guida autonoma. anche se sarà la fine dei giochi resta da verificare nel tempo. anche lou tiancheng ha una visione simile, ritenendo che sia l2 che l4 la guida autonoma è già in fase di realizzazione, ma la qualità e l’ambito di attuazione prevedono requisiti e standard tecnologici diversi.

per la guida autonoma di livello l2, la tecnologia end-to-end è attualmente la strada migliore; per la guida autonoma di livello l4, la tecnologia end-to-end può aiutare ad aprire rapidamente nuove aree. tuttavia, l4 ha requisiti di sicurezza più elevati, che devono essere più di 10 volte quelli dei conducenti umani. pertanto, oltre all’utilizzo end-to-end, è anche necessario incorporare istruzioni ad alto determinismo basate sulle intenzioni di guida e sugli scenari applicativi. come le norme sul traffico, le preferenze di guida, ecc.

liu yudong ha tratto una conclusione più cauta: "al momento, l'end-to-end è la fine prevedibile della guida autonoma in futuro, ma ci sono varie possibilità per l'evoluzione tecnologica a lungo termine. proprio come abbiamo fatto tre anni fa. inaspettatamente, una emergerà una tecnologia come chatgpt e tra due o tre anni potrebbe emergere una nuova architettura tecnica per sovvertire l’attuale chatgpt”.

il 100% end-to-end non è ancora apparso, qual è la "migliore pratica"?

sebbene non sia ancora chiaro se l’end-to-end sia la soluzione finale per la guida autonoma, la sua applicazione pratica è chiaramente diventata una soluzione consensuale nel settore della guida intelligente. tuttavia, ci sono ancora molte controversie nel settore riguardo alla scelta del percorso tecnologico di guida autonoma end-to-end.

allo stato attuale, zero one automotive sta avanzando lungo il percorso end-to-end basato su modelli linguistici multimodali di grandi dimensioni e non solo ha ottenuto risultati su alcuni set di dati pubblici, ma anche nella guida autonoma detenuta dallo shanghai artificial intelligence laboratory quest'anno, insieme a cvpr e altri, nell'international challenge, con la sua soluzione di guida autonoma puramente visiva, ha ottenuto il secondo posto tra 143 team internazionali nel percorso di guida autonoma end-to-end.

wang panqu ritiene che la modularità end-to-end equivalga a una fase iniziale di esplorazione e possa essere implementata più rapidamente. attualmente, anche il mondo accademico e l’industria dispongono di soluzioni relativamente mature. l’adozione di un percorso tecnico end-to-end basato su grandi modelli multimodali ha il potenziale per trasformare la guida autonoma in un business redditizio, e solo un modello di base con una forte generalizzazione può apportare l’iniezione di conoscenza e l’integrazione necessarie nel campo della guida autonoma. guida autonoma.

in poche parole, la forte generalizzazione dei modelli di grandi dimensioni porterà vantaggi prestazionali all’intero sistema end-to-end e consentirà anche di ottenere in futuro una guida autonoma di fascia alta redditizia nella produzione di massa su larga scala. inoltre, in futuro, questi due percorsi tecnici end-to-end basati su grandi modelli multimodali e modelli mondiali potranno essere riutilizzati tra loro.

liu yudong ha affermato che, in linea di principio, un modello è più vicino alla forma dell'agi in altri campi, mentre il modello mondiale è attualmente principalmente uno strumento per la generazione di dati e ci vorrà più tempo per vedere se può essere utilizzato come sistema di guida autonoma. . nei prossimi due anni, ci sono due tipi principali di soluzioni end-to-end: una è modulare end-to-end, il tipico rappresentante è uniad dello shanghai artificial intelligence laboratory; l'altra è quella basata su grandi modelli multimodali . modello end-to-end, come lingo-2 di wayve e drivevlm recentemente lanciato da lili.

per quanto riguarda il modello mondiale, mao jiming aveva una visione diversa. ritiene che il modello mondiale sia una soluzione end-to-end ragionevole. basandosi sul modello mondiale, l'algoritmo di guida intelligente ha la capacità di comprendere la scena e fare previsioni ragionevoli sul futuro e prendere decisioni basate su queste informazioni. questa è una soluzione più in linea con la logica del pensiero umano.

zhu zheng, co-fondatore e capo scienziato di jiji technology, ha inoltre aggiunto che l'addestramento di un modello richiede molte risorse e tempo e richiede requisiti molto elevati in termini di portata e qualità dei dati. il metodo end-to-end utilizza le capacità di previsione del modello per prendere decisioni sulla percezione della scena e sul comportamento di guida, che sono più coerenti con i comportamenti e le abitudini di guida umane. secondo la sua introduzione, jiji attualmente ha un sistema prototipo di base end-to-end basato sul modello mondiale e lo sta verificando congiuntamente con un produttore di automobili, e presto alcuni progressi saranno resi pubblici.

nell'agosto dello scorso anno, pony.ai ha unificato i tre moduli tradizionali di percezione, previsione e controllo in un unico modello di guida autonoma end-to-end. ora è stato installato simultaneamente nei taxi autonomi l4 e nelle autovetture a guida assistita l2. . secondo lou tiancheng, sia il modello modulare end-to-end che quello unico sono attualmente nelle fasi iniziali e non sono ancora stati verificati per la produzione e la consegna in serie. si prevede che nei prossimi 1 o 2 anni il percorso tecnico end-to-end passerà dal disaccordo al consenso.

"a lungo termine, l'end-to-end end-to-end finirà per assumere la forma di un modello unico." mao jiming ha affermato che nella situazione attuale, l'end-to-end "a due fasi" utilizzato dalle aziende come huawei e xiaopeng è ancora un'implementazione semi-end-to-end, o in uno stato di transizione end-to-end piuttosto che in uno stato completo.

non molto tempo fa,estremoanche il ceo del settore automobilistico xia yiping ha dichiarato pubblicamente: "nessuno sul mercato è veramente end-to-end, sono tutti espedienti di marketing. resta inteso che l'attuale soluzione di guida intelligente end-to-end di jiyue utilizza anche un "due stadi". "architettura tecnica.

l'attributo "scatola nera" è un malinteso e può essere reso simile ad una scatola grigia o ad una scatola bianca

una serie di vantaggi della soluzione end-to-end derivano dalla sua architettura che integra più moduli, ma questo design rende anche il sistema più vicino a una "scatola nera" rispetto alla comprensibile "scatola bianca" originale, quindi ha più "inspiegabilità" ".

lou tiancheng ritiene che l'inspiegabilità sia un difetto naturale del sistema end-to-end, ma se limiterà lo sviluppo della tecnologia di guida autonoma end-to-end dipende dalla situazione. per l2, la non interpretabilità non influisce sulle applicazioni end-to-end. ad esempio, la modularità end-to-end conserva ancora ciascun modulo funzionale principale e le caratteristiche di output intermedio possono essere ulteriormente estratte in dati interpretabili.

per l4 i requisiti di sicurezza e certezza sono molto più elevati di quelli di l2. pertanto, è necessario incorporare istruzioni regolari nel modello, come le norme sul traffico, le preferenze di guida, ecc., per aiutare il modello di guida autonoma end-to-end a comprendere meglio le intenzioni di guida. allo stesso tempo, anche le capacità del modello devono essere aggiornate per trasmettere le intenzioni di guida al mondo esterno per migliorare ulteriormente l’interpretabilità.

dal punto di vista di zhu zheng, sebbene l'end-to-end sia effettivamente una scatola nera dal livello del prodotto e dalla forma finale di ricerca e sviluppo, dal punto di vista di ingegneri e progettisti di prodotto, compresi gli utenti, l'end-to-end può essere reso simile alla scatola grigia. scatola o scatola bianca.

innanzitutto, la modularità articolare end-to-end distingue nel dettaglio i tre moduli di percezione, previsione e pianificazione. qualsiasi risultato progettuale può essere associato ad un modulo intermedio precedente. in secondo luogo, un modello può produrre risultati intermedi modularizzati. contrassegnare i risultati per la supervisione intermedia può far convergere meglio un modello e i risultati intermedi modellati possono anche essere mostrati a ingegneri o utenti. in terzo luogo, la cosa più importante di un modello mondiale è la sua capacità predittiva, e i suoi risultati di previsione possono anche essere associati a risultati intermedi strutturati.

mao jiming ha affermato che l'attuale dichiarazione end-to-end della "scatola nera" è un malinteso sui dettagli dell'inferenza dell'addestramento dell'intero modello. finché la cognizione di ricerca e sviluppo viene presentata in una forma che può essere spiegata esternamente, non è più una scatola nera.

wang panqu ritiene inoltre che la proposta di inspiegabilità rifletta la fiducia del pubblico nella tecnologia, vale a dire se le prestazioni della tecnologia stessa raggiungono uno standard accettabile per tutti. con lo sviluppo della progettazione basata sui dati, degli algoritmi, della sicurezza dei modelli di grandi dimensioni e di altre tecnologie correlate, nei prossimi uno o due anni si verificherà un enorme balzo in avanti in termini di prestazioni e affidabilità end-to-end. attraverso test delle prestazioni su larga scala e una verifica completa, la sua interpretabilità non sarà più un problema critico.

il “picco” dell’onboarding end-to-end sta arrivando e i veicoli commerciali verranno lanciati più velocemente

"il lancio su larga scala dell'end-to-end modulare è avvenuto nell'ultimo anno, mentre l'end-to-end basato su modelli linguistici di grandi dimensioni richiederà altri 1 o 2 anni." wang panqu ha sottolineato che la guida autonoma l4 è commerciale i veicoli devono essere più veloci dell’implementazione delle autovetture. il motivo è che i sistemi di guida autonoma di fascia alta che possono essere prodotti in serie in grandi quantità sono molto difficili da implementare negli scenari dei veicoli commerciali che sono più semplici delle autovetture scenario è facile chiudere il ciclo a livello commerciale ed è anche conveniente eseguire scene asintotiche.

liu yudong è più ottimista, credendo che il prossimo anno il modulare end-to-end e un modello end-to-end inizieranno a essere spinti più intensamente. inoltre, liu yudong ha affermato che, dal punto di vista del grado radicale di sviluppo tecnologico e di raccolta di talenti, della velocità dell'iterazione tecnologica e della difficoltà dell'applicazione tecnologica, i tempi effettivi di implementazione dei veicoli commerciali e dei veicoli passeggeri end-to-end potrebbero essere simili , ma l'ambito di implementazione dei veicoli passeggeri sarà più ampio di quello dei veicoli commerciali e i veicoli commerciali si svilupperanno lentamente nelle fasi successive.

“questi ostacoli devono essere superati prima della produzione di massa end-to-end. il primo è la preparazione della potenza di calcolo a bordo del veicolo, il secondo è l’iterazione dell’algoritmo end-to-end, il terzo è la scala dei dati cloud. il quarto è la scala della potenza di calcolo, e il terzo è l’iterazione dell’algoritmo end-to-end, il quinto è il piano di verifica”, ha detto mao jiming.

a suo avviso, tesla e i principali oem e aziende nazionali come wei xiaoli e huawei sono già dotati di tutti e tre gli aspetti della potenza di calcolo del veicolo, della scala dei dati nel cloud e della scala della potenza del cloud computing. dalla fine di quest’anno alla prima metà del prossimo anno, gli algoritmi end-to-end di diverse aziende automobilistiche leader potranno essere lanciati su larga scala a partire dalla seconda metà del prossimo anno, come anticipa l’industria; in un'esplosione di produzione e lancio di massa end-to-end.

andare end-to-end, significa “ricominciare”?

lo sviluppo e l’adozione di sistemi end-to-end porteranno senza dubbio una rivoluzione tecnologica alla soluzione complessiva di guida intelligente. dobbiamo quindi rovesciare la tecnologia precedente per entrare nel mercato end-to-end?

liu yudong ritiene che la tecnologia di guida autonoma originale non sarà completamente sovvertita e condividerà con essa determinati algoritmi e accumulo di software end-to-end.

la prima è la parte della percezione. molte parti di elaborazione delle informazioni della telecamera front-end end-to-end ora utilizzano metodi bev, come backbone o codificatore. la seconda riguarda la parte di regolamentazione e controllo. parte del know-how originale in materia di regolamentazione e controllo può essere migrato nel sistema end-to-end. il terzo è l’infrastruttura dati. si tratta di una capacità importante di cui le aziende avranno bisogno in futuro per le operazioni end-to-end. le aziende che possono implementare soluzioni bev dispongono anche di un’infrastruttura dati relativamente solida.

secondo mao jiming, l'eventuale ribaltamento dipenderà da quale fosse la soluzione tecnica precedente. ha affermato che il nucleo end-to-end è un grande modello multimodale basato sui dati. se la precedente soluzione tecnica di una certa azienda di guida intelligente ha molte regole, allora queste regole verranno sostanzialmente ribaltate se la precedente soluzione tecnica le ha già la maggior parte è stata modificata in model-driven, quindi c'è un'alta probabilità che questa parte del codice possa essere riutilizzata in qualche forma.

è necessario sottolineare che i cambiamenti nel modello di ricerca e sviluppo apportati dall’algoritmo end-to-end sono al centro di ogni oem e azienda di guida autonoma, ed è anche il luogo più doloroso.

wang panqu ha anche affermato che oltre alla fine del modello, è necessario svolgere più lavoro sui dati end-to-end: in primo luogo, è necessario ricostruire il sistema di dati a circuito chiuso e la sua efficienza di iterazione e, in secondo luogo, end-to-end test e verifica, sensori dell'intera piattaforma di simulazione l'input deve essere molto realistico, il che al momento è una questione tecnica molto impegnativa. ma in termini di costi di manodopera, il costo complessivo di un sistema di guida intelligente end-to-end è inferiore a quello di un sistema non-end-to-end, perché ci sono solo pochi moduli nel sistema end-to-end e il team principale di 20-30 ingegneri dovrebbe essere sufficiente.

inoltre, mao jiming ha sottolineato che, passando dalla tradizionale architettura modulare al modello end-to-end, cambierà anche la struttura dei costi delle soluzioni di guida intelligente: il costo del lavoro di un gran numero di esperti di ricerca e sviluppo che scrivono varie regole migrerà verso l'aspetto dei dati. questa è una buona cosa per gli oem con capacità di produzione di massa. a causa del minor costo di acquisizione dei dati, il costo complessivo delle soluzioni di guida intelligente diminuirà ulteriormente in modo significativo.

in termini di investimenti in potenza di calcolo, lou tiancheng ha affermato che a breve termine, l'acquisto di chip di potenza di calcolo di grandi dimensioni aumenterà effettivamente i costi attuali. ma nel lungo periodo, una volta che la tecnologia end-to-end sarà matura e applicata, il costo dell’investimento iniziale verrà gradualmente diluito.

il puro investimento in potenza di calcolo end-to-end è inferiore a quello dell’architettura modulare, che ammonta ad almeno 100-200 milioni all’anno.

"se si desidera che il modello end-to-end raggiunga un livello di formazione relativamente buono, saranno necessari almeno 100-200 milioni di investimenti in potenza di calcolo all'anno e il numero di binari per autovetture sarà sicuramente ancora più impressionante ."

secondo wang panqu, la potenza di calcolo richiesta end-to-end è divisa in due aspetti: formazione e implementazione. la distribuzione equivale al numero di controller di dominio che è necessario acquistare. questo costo è fisso e relativamente basso, correlato al costo di un singolo veicolo. il costo maggiore è quello della formazione, che può essere suddiviso in due tipologie: carte autocostruite e acquistate o collaborazione con fornitori di servizi cloud. per le aziende automobilistiche con ordini relativamente grandi, costruire i propri data center è un’opzione conveniente; ma per le aziende automobilistiche con ordini meno grandi o nelle prime fasi di ricerca e sviluppo, noleggiare server da fornitori di servizi cloud è una scelta migliore.

in precedenza, lang xianpeng, vicepresidente della guida intelligente di li auto, aveva rivelato pubblicamente che li auto attualmente spende 1 miliardo di yuan ogni anno in formazione sulla potenza di calcolo e si prevede che spenderà 1 miliardo di dollari ogni anno in futuro. "se non riusciamo a spendere 1 miliardo di dollari all'anno per la formazione, potremmo essere eliminati dalla futura competizione di guida autonoma."

in termini di scala della potenza di calcolo, lou tiancheng ritiene che se si tratta solo di un semplice addestramento sul modello di guida autonoma end-to-end, centinaia di gpu con grande potenza di calcolo possono supportarlo. se sono necessari investimenti a lungo termine e viene garantita la qualità end-to-end, la potenza di calcolo della formazione di ciascuna azienda di guida autonoma è sostanzialmente al livello di migliaia di calorie e le aziende automobilistiche investiranno di più.

mao jiming ha fornito requisiti di potenza di calcolo end-to-end più specifici: l'intero sistema richiede almeno due nvidia orin o un singolo nvidia thor. ha affermato che i requisiti di potenza di calcolo di un sistema end-to-end puro sono inferiori ai requisiti di potenza di calcolo totali di un'architettura modulare. tuttavia, oltre al sistema principale, la produzione di massa end-to-end ha spesso un sistema di bypass e i suoi requisiti di potenza di calcolo sono generalmente gli stessi di quelli della precedente architettura modulare equivalente.

tuttavia, wang panqu ritiene che con l’aumento delle capacità dei chip informatici di bordo veicolo, la potenza di calcolo non diventerà un ostacolo all’onboarding end-to-end in futuro. lou tiancheng è della stessa opinione, affermando che dall'architettura classica a quella end-to-end, il numero totale di codici sarà significativamente ridotto e il consumo di risorse di calcolo portato dalla rete neurale end-to-end non sarà necessariamente significativamente ridotto. migliorato rispetto al modello bev.

"il desiderio di una maggiore potenza di calcolo deriva più dal miglioramento dei parametri del modello e delle prestazioni del modello, piuttosto che dalla trasformazione end-to-end. inoltre, ha sottolineato che dal punto di vista delle applicazioni di atterraggio end-to-end." le aziende interessate dovrebbero riflettere di più la cosa più importante è come sfruttare appieno le risorse di chip computing esistenti per migliorare l'efficienza di utilizzo.