nachricht

eine milliarde pro jahr auszugeben, ist nur der anfang. können die „mythischen“ durchgängigen „best practices“ im kreis des autonomen fahrens in china geld verdienen?

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autor|hua wei

es wird erwartet, dass in weniger als einem halben jahrtesla fsd wird offiziell nach china eintreten. am 5. september gab tesla bekannt, dass fsd im ersten quartal 2025 in china und europa eingeführt wird.

vor nicht allzu langer zeit erhielt die end-to-end-version des tesla fsd v12 nach ihrer einführung viel lob von der branche und außerhalb der branche. sogar diejenigen, die sich schon oft offen mit tesla „gestritten“ habenxpeng-motorenvorsitzender he xiaopeng veröffentlichte außerdem eine nachricht, in der er kommentierte, dass teslas autonomes fahren „extrem gut funktioniert“ und erklärte begeistert, dass „2025 der chatgpt-moment für vollständig autonomes fahren sein wird!“

die von gpt vertretenen großen modelle haben mit ihrer beispiellosen innovationsgeschwindigkeit und technischen architektur einen tiefgreifenden einfluss auf das forschungs- und entwicklungsmodell des programms im bereich des autonomen fahrens, und die globale industrie reagiert schnell auf diese begeisterung. gemessen am aktuellen fokus inländischer automobilhersteller ist end-to-end auch zu ihrem technologieweg der nächsten generation für autonomes fahren geworden.

unternehmen für autonomes pkw-fahren wie huawei, xpeng, pony.ai, momenta, jiji technology und horizon ziehen aktiv nach und haben end-to-end-lösungen und modelle für autonomes fahren für die massenproduktion auf den markt gebracht. im hinblick auf nutzfahrzeuge kündigte zero one automobile außerdem einen klaren zeitplan für die einführung des durchgängigen großmodells für das fahrzeug an.ideales autogründer und ceo li xiang behauptete außerdem öffentlich, dass li auto innerhalb von drei jahren autonomes fahren der stufe l4 erreichen werde, basierend auf end-to-end- und weltmodellen.

sogar der l4-markt für autonomes fahren, der zuvor eine „kältewelle“ erlebt hatte, hat sich durch die einführung der end-to-end-technologie erholt. ein gutes beispiel ist wayve, das sich auf dieses technische konzept stützte, um eine finanzierung in höhe von 1 milliarde us-dollar zu erhalten. liu yudong, investmentmanager von chentao capital, sagte: „end-to-end eröffnet die zweite wachstumskurve für die l4-kommerzialisierung.“

tesla, das mit end-to-end-fähigkeiten einen sprung bei den fsd-fähigkeiten gemacht hat, kündigte außerdem an, dass es am 10. oktober das robotaxi-modell auf den markt bringen wird. he xiaopeng gab außerdem öffentlich bekannt, dass xpeng motors im jahr 2026 robotaxi auf den markt bringen wird. allerdings haben die jüngsten maßnahmen und erwartungen von automobilherstellern und herstellern autonomen fahrens, durch end-to-end-lösungen die massenproduktion von l4 zu erreichen, bei vielen praktikern des autonomen fahrens die frage aufgeworfen: wurde end-to-end zu „mythetisch“ dargestellt?

warum wird end-to-end zur „spitzenklasse“ im smart-driving-kreis?

end-to-end ist nicht erst in den letzten zwei jahren entstanden. bereits 2017 haben viele unternehmen die möglichkeit dieses technischen weges geprüft. in diesem jahr ist „end-to-end“ im autonomen fahrkreis populär geworden und gilt in der branche als killertechnologie. zusätzlich zu den innovationen, die große sprachmodelle wie chatgpt mit sich bringen, ist es auch untrennbar mit seiner eigenen technologie verbunden. charme".

„die geburt des end-to-end-modells ist die einzige möglichkeit für die technologie des autonomen fahrens, zu einer groß angelegten kommerzialisierung zu führen.“ lou tiancheng, mitbegründer und chief technology officer von pony.ai, sagte, dass dies einer der größten vorteile sei der vorteil des end-to-end-modells besteht darin, dass es durch seine generalisierbarkeit die geschwindigkeit der kommerzialisierung des autonomen fahrens erhöhen und die popularisierung des autonomen fahrens beschleunigen kann.

laut wang panqu, leiter für intelligentes fahren bei zero one automobile, weisen herkömmliche, nicht durchgängige autonome fahrsysteme nicht nur eine schlechtere verallgemeinerung auf als end-to-end-systeme, sondern auch bei der ausweitung auf neue szenarien sind viele zuvor verwendete regel- basierte lösungen werden wenn es fehlschlägt, wird der neu hinzugefügte code die wartbarkeit des systems verschlechtern, was zu einem anstieg der grenzkosten führt.

darüber hinaus haben traditionelle autonome fahrsysteme auch zwei nachteile. der erste grund ist die komplexität der architektur, die nicht nur höhere entwicklungskosten mit sich bringt, sondern auch eine geringere leistungsgrenze aufweist, da jedem modul weniger rechenressourcen zugewiesen werden, was auch viele technische optimierungsprobleme mit sich bringt. das zweite ist das hohe kostenproblem, das durch die komplexe architektur verursacht wird. jedes modul erfordert entwicklung, wartung, projektmanagement und integration. dies ist auch der grund, warum die teamgröße traditioneller autonomer fahrunternehmen sehr groß ist.

„meiner meinung nach kann end-to-end diese probleme sehr gut lösen.“ wang panqu sagte, dass end-to-end aus architektonischer sicht nur ein modul hat, das komplexe architekturprobleme gut lösen kann und auch über das verfügt möglichkeit zur kostensenkung und effizienzsteigerung. die durch daten und sogar wissen getriebene end-to-end-verallgemeinerung ist sehr stark und wird wahrscheinlich schnell in die massenproduktion umgesetzt. sie kann nicht nur die kosten für die anpassung von l2 an verschiedene modelle senken, sondern auch dazu beitragen, dass l4 die anpassungszeit verkürzt zu verschiedenen szenarien.

darüber hinaus wies lou tiancheng darauf hin, dass der größte vorteil von end-to-end darin besteht, den informationsverlust zwischen verschiedenen modulen und funktionen zu verhindern. mao jiming, vizepräsident für technik bei jiji technology, ging ebenfalls auf diesen aspekt ein und erklärte, dass die effektive übertragung von informationen zwischen modulen die frage der effektiven informationsübertragung beinhalte. die schnittstellen vor- und nachgelagerter module definieren die obergrenze der informationsübertragung. aber egal wie ausgefeilt das interface-design ist, es wird zu informationsverlusten kommen. die end-to-end-lösung mit einheitlichen modulen leidet nicht unter diesem informationsverlust, was dazu beiträgt, den endgültigen algorithmuseffekt zu verbessern.

gleichzeitig sprach mao jiming auch über weitere vorteile der end-to-end-architektur. erstens gibt es in bezug auf modulfehler keinen fehlerverstärkungseffekt mehrerer module, da end-to-end unter einem modul liegt und die obergrenze der fähigkeiten des gesamten intelligenten fahralgorithmus maximiert werden kann. zweitens hat in der multi-modul-architektur jedes modul seinen eigenen f&e-rhythmus und seine eigenen optimierungsziele, die nicht immer strikt auf die globalen optimierungsziele des gesamten intelligenten fahrsystems abgestimmt werden können, was zu einer potenziell ineffektiven optimierung und einer verschwendung von f&e-ressourcen führt das ende die end-to-end-architektur besteht nur aus einem modul und die optimierungsziele sind klar und einheitlich, wodurch dieser interne reibungsoptimierungsprozess effektiv vermieden werden kann.

ein weiterer punkt ist, dass die komponenten der modularen architektur natürlich leicht mehrere regelgesteuerte „domänen“ bilden, was eine reihe von wartungsherausforderungen und eckfalllösungsdilemmas mit sich bringt und als typische vollständig datengesteuerte architektur durchgängig ist. wird dazu führen, dass entwickler proaktiver sind und beginnen, probleme anhand eines datengesteuerten und modellgesteuerten denkparadigmas zu betrachten und zu lösen, wodurch das kognitive niveau des gesamten algorithmenteams verbessert wird.

„insgesamt ist die entwicklungseffizienz des end-to-end-systems höher und der ressourcenverbrauch geringer.“ engineering-ressourcen und verlagerung des ressourcenfokus des unternehmens. verlagerung hin zu einer hohen talentdichte in datengesteuerten aspekten und investitionen in die datenakkumulation.

es ist erwähnenswert, dass auch der benutzernutzen, den end-to-end mit sich bringt, große aufmerksamkeit erregt hat. liu yudong wies darauf hin, dass das end-to-end-system erstens im hinblick auf die verarbeitung von long-tail-szenarien extremere szenarien abdecken kann als das ursprüngliche system, beispielsweise die verarbeitungsfähigkeiten des gesunden menschenverstands. zweitens ist das verhalten des autonomen fahrsystems eher anthropomorph und kann auch ein stärkeres vertrauen zwischen verbrauchern und dem system aufbauen. in szenarien mit starkem spielverhalten ähnelt es eher einem menschlichen fahrer.

die obergrenze ist hoch und die untergrenze ist niedrig. ist das „ende“ des autonomen fahrens schon erreicht?

obwohl die technischen end-to-end-vorteile erheblich sind und viele automobilhersteller und unternehmen für autonomes fahren end-to-end-anwendungen aktiv verfolgen, gibt es in der branche immer noch unterschiedliche meinungen über das sogenannte „end-game-modell“. ."

anhänger wie wang panqu sagten: „ich glaube, dass end-to-end die endgültige form der realisierung autonomen fahrens sein muss, aber end-to-end ist nur ein technischer rahmen, aber es gibt tatsächlich viele optionen für spezifische implementierungsmethoden.“ die branche hat noch keinen konsens erzielt.“

rationalisten wie mao jiming wiesen darauf hin, dass die end-to-end-lösung die merkmale einer „hohen obergrenze, aber einer niedrigen untergrenze“ aufweist. laienhaft ausgedrückt: wenn es gut gemacht wird, können gute ergebnisse erzielt werden, aber wenn es schlecht gemacht wird, wird es schlechter sein als herkömmliche lösungen. ob man sich für eine end-to-end-lösung entscheidet, hängt aus sicht von mao jiming vom konkreten anwendungsszenario ab. für autonomes fahren der stufe l5 ist end-to-end die einzige lösung, für l2 und l3 ist end-to-end jedoch nur eine der möglichen lösungen. darüber hinaus muss die end-to-end-anwendung mit anderen technischen lösungen kombiniert werden.

„end-to-end bietet einen guten technischen weg für die schnelle und groß angelegte popularisierung des autonomen fahrens. ob es sich dabei um das endspiel handelt, vertritt auch lou tiancheng, der glaubt, dass sowohl l2 als auch l4 eine ähnliche ansicht haben.“ autonomes fahren wird bereits realisiert, die qualität der umsetzung und der umfang der umsetzung stellen jedoch unterschiedliche anforderungen und standards an die technologie.

für autonomes fahren auf l2-ebene ist die end-to-end-technologie derzeit der bessere weg. für autonomes fahren auf l4-ebene kann end-to-end dabei helfen, schnell neue bereiche zu erschließen. allerdings stellt l4 höhere sicherheitsanforderungen, die mehr als zehnmal höher sein müssen als die von menschlichen fahrern. daher ist es neben der verwendung von end-to-end auch erforderlich, anweisungen mit hohem determinismus zu integrieren, die auf fahrabsichten und anwendungsszenarien basieren. wie verkehrsregeln, fahrpräferenzen usw.

liu yudong zog ein vorsichtigeres fazit: „derzeit ist end-to-end das absehbare ende des autonomen fahrens in der zukunft, aber es gibt verschiedene möglichkeiten für eine längerfristige technologieentwicklung. genau wie wir es vor drei jahren getan haben. unerwartet, a technologien wie chatgpt werden entstehen, und in zwei oder drei jahren könnte eine neue technische architektur entstehen, um das aktuelle chatgpt zu untergraben.“

100 % end-to-end ist noch nicht erschienen, was ist „best practice“?

obwohl noch nicht klar ist, ob end-to-end die endgültige lösung für autonomes fahren ist, ist seine praktische anwendung eindeutig zu einer konsenslösung in der branche des intelligenten fahrens geworden. allerdings gibt es in der branche immer noch viele kontroversen über die wahl des technologiepfads für das durchgängige autonome fahren.

derzeit schreitet zero one automotive auf der grundlage multimodaler großer sprachmodelle voran und hat nicht nur ergebnisse bei einigen öffentlichen datensätzen erzielt, sondern auch beim autonomen fahren des shanghai artificial intelligence laboratory in der diesjährigen international challenge erreichte das unternehmen mit seiner rein visuellen autonomen fahrlösung den zweiten platz unter 143 internationalen teams auf der durchgängigen autonomen fahrstrecke.

wang panqu glaubt, dass modulare end-to-end-lösungen einem frühen stadium der erforschung entsprechen und schneller implementiert werden können. derzeit verfügen auch wissenschaft und industrie über relativ ausgereifte lösungen. die einführung einer durchgängigen technischen route auf der grundlage multimodaler großmodelle hat das potenzial, autonomes fahren zu einem profitablen geschäft zu machen, und nur ein basismodell mit starker verallgemeinerung kann die im bereich erforderliche wissensinjektion und integration bringen autonomes fahren.

vereinfacht ausgedrückt wird die starke verallgemeinerung großer modelle leistungsvorteile für das gesamte end-to-end-system bringen und es auch ermöglichen, in zukunft profitables high-end-autonomes fahren in großserienproduktion zu erreichen. darüber hinaus können diese beiden durchgängigen technischen routen, die auf multimodalen großmodellen und weltmodellen basieren, in zukunft miteinander wiederverwendet werden.

liu yudong sagte, dass ein modell im prinzip näher an der form von agi in anderen bereichen sei, während das weltmodell derzeit hauptsächlich ein werkzeug zur datengenerierung sei und es länger dauern werde, bis sich herausstelle, ob es als autonomes fahrsystem eingesetzt werden könne . in den nächsten zwei jahren wird es zwei haupttypen von end-to-end-lösungen geben: eine ist modulare end-to-end-lösung, der typische vertreter ist uniad des shanghai artificial intelligence laboratory, die andere basiert auf multimodalen großmodellen . end-to-end-modelle wie wayves lingo-2 und lilis kürzlich eingeführtes drivevlm.

was das weltmodell anbelangt, vertrat mao jiming eine andere ansicht. er glaubt, dass das weltmodell eine vernünftige end-to-end-lösung ist. basierend auf dem weltmodell ist der intelligente fahralgorithmus in der lage, die szene zu verstehen, vernünftige vorhersagen über die zukunft zu treffen und auf der grundlage dieser informationen entscheidungen zu treffen. dies ist eine lösung, die eher der logik des menschlichen denkens entspricht.

zhu zheng, mitbegründer und chefwissenschaftler von jiji technology, fügte außerdem hinzu, dass das training eines modells sehr ressourcen- und zeitintensiv sei und sehr hohe anforderungen an den umfang und die qualität der daten stelle. die end-to-end-methode nutzt modellvorhersagefunktionen, um szenenwahrnehmung und fahrverhaltensentscheidungen zu treffen, die besser mit dem menschlichen fahrverhalten und den fahrgewohnheiten übereinstimmen. seiner einführung zufolge verfügt jiji derzeit über ein durchgängiges basisprototypsystem, das auf dem weltmodell basiert, und verifiziert es gemeinsam mit einem automobilhersteller. einige fortschritte werden bald veröffentlicht.

im august letzten jahres hat pony.ai die drei traditionellen module wahrnehmung, vorhersage und steuerung zu einem durchgängigen autonomen fahrmodell vereint. es wurde nun gleichzeitig in autonomen l4-taxis und unterstützten fahr-pkw der stufe l2 installiert. . nach ansicht von lou tiancheng befinden sich sowohl das modulare end-to-end-modell als auch das einzelmodell derzeit in der anfangsphase und wurden noch nicht für die massenproduktion und -auslieferung verifiziert. es wird erwartet, dass der durchgängige technische weg in den nächsten ein bis zwei jahren von der meinungsverschiedenheit zum konsens übergehen wird.

„langfristig wird das end-to-end-modell irgendwann die form eines einzigen modells annehmen.“ mao jiming sagte, dass in der aktuellen situation das „zweistufige“ end-to-end-modell von unternehmen verwendet wird wie huawei und xiaopeng ist immer noch eine semi-end-to-end-implementierung oder befindet sich eher in einem end-to-end-übergangszustand als in einem vollständigen zustand.

vor nicht allzu langer zeit,extremxia yiping, ceo von automotive, sagte auch öffentlich: „niemand auf dem markt ist wirklich durchgängig, das sind alles marketing-gimmicks.“ „technische architektur.

das attribut „black box“ ist ein missverständnis und kann einer grey box oder einer white box ähnlich gemacht werden

eine reihe von vorteilen der end-to-end-lösung ergeben sich aus ihrer architektur, die mehrere module integriert. durch dieses design ähnelt das system jedoch auch eher einer „black box“ als der ursprünglich verständlichen „white box“ und weist daher eine größere „unerklärlichkeit“ auf ".

lou tiancheng glaubt, dass unerklärlichkeit ein natürlicher fehler des end-to-end-systems ist, aber ob es die entwicklung der end-to-end-technologie für autonomes fahren einschränkt, hängt von der situation ab. für l2 hat die uninterpretierbarkeit keinen einfluss auf end-to-end-anwendungen. beispielsweise behält modulares end-to-end weiterhin jedes hauptfunktionsmodul bei, und die zwischenausgabefunktionen können weiter in interpretierbare daten extrahiert werden.

für l4 sind die anforderungen an sicherheit und gewissheit viel höher als für l2. daher ist es notwendig, regelmäßige anweisungen wie verkehrsregeln, fahrpräferenzen usw. in das modell zu integrieren, um dem end-to-end-modell für autonomes fahren zu helfen, die fahrabsichten besser zu verstehen. gleichzeitig müssen auch die modellfähigkeiten verbessert werden, um fahrabsichten an die außenwelt auszugeben und so die interpretierbarkeit weiter zu verbessern.

nach ansicht von zhu zheng ist end-to-end zwar tatsächlich eine black box auf produktebene und in der endgültigen f&e-form, aus der sicht von ingenieuren und produktdesignern, einschließlich benutzern, kann end-to-end jedoch einer grey box ähnlich gemacht werden. box oder weiße box.

erstens unterscheidet die modulare end-to-end-verbindung die drei module wahrnehmung, vorhersage und planung im detail. jedes planungsergebnis kann einem vorherigen zwischenmodul zugeordnet werden. zweitens kann ein modell modularisierte zwischenergebnisse ausgeben. durch markieren der ergebnisse zur zwischenüberwachung kann die konvergenz eines modells verbessert werden, und die modellierten zwischenergebnisse können auch ingenieuren oder benutzern angezeigt werden. drittens ist das wichtigste an einem weltmodell seine vorhersagefähigkeit, und seine vorhersageergebnisse können auch mit strukturierten zwischenergebnissen verknüpft werden.

mao jiming sagte, dass die aktuelle end-to-end-„black-box“-aussage ein missverständnis der trainingsinferenzdetails des gesamten modells sei. solange f&e-erkenntnisse in einer von außen erklärbaren form dargestellt werden, handelt es sich nicht mehr um eine black box.

wang panqu glaubt auch, dass der vorschlag der unerklärlichkeit das vertrauen der öffentlichkeit in die technologie widerspiegelt, das heißt, ob die leistung der technologie selbst einen für alle akzeptablen standard erreicht. mit der entwicklung von datengesteuertem algorithmusdesign, großer modellsicherheit und anderen verwandten technologien wird es in den nächsten ein bis zwei jahren einen enormen sprung in der end-to-end-leistung und -zuverlässigkeit geben. durch groß angelegte leistungstests und vollständige verifizierung wird die interpretierbarkeit kein kritisches problem mehr darstellen.

der „höhepunkt“ des end-to-end-onboardings steht bevor und nutzfahrzeuge werden schneller auf den markt kommen

„die groß angelegte einführung modularer end-to-end-modelle wird noch im vergangenen jahr erfolgen, und die einführung von end-to-end-modellen auf basis großer sprachmodelle wird weitere 1 bis 2 jahre dauern.“ der grund dafür ist, dass autonome fahrsysteme der spitzenklasse, die in großen stückzahlen hergestellt werden können, in szenarien für nutzfahrzeuge nur sehr schwer zu implementieren sind es ist einfach, den kreis kommerziell zu schließen, und es ist auch praktisch, szenenasymptotiken durchzuführen.

liu yudong ist optimistischer und geht davon aus, dass modulare end-to-end- und ein-modell-end-to-end-lösungen im nächsten jahr stärker vorangetrieben werden. darüber hinaus sagte liu yudong, dass die tatsächliche implementierungszeit von end-to-end-nutzfahrzeugen und personenkraftwagen angesichts des radikalen ausmaßes der technologischen entwicklung und der talentgewinnung, der geschwindigkeit der technologischen iteration und der schwierigkeit der technologischen anwendung ähnlich sein könnte , aber der umfang der umsetzung von personenkraftwagen wird größer sein als der von nutzfahrzeugen, und nutzfahrzeuge werden sich in späteren phasen langsam weiterentwickeln.

„diese hürden müssen vor der end-to-end-massenproduktion überwunden werden. die erste ist die vorbereitung der fahrzeugseitigen rechenleistung, die zweite ist die iteration des end-to-end-algorithmus, die dritte ist der umfang der cloud-daten.“ der vierte ist der umfang der rechenleistung und der dritte ist die iteration des end-to-end-algorithmus. der fünfte ist der verifizierungsplan“, sagte mao jiming.

seiner ansicht nach sind tesla und inländische führende oems und unternehmen wie wei xiaoli und huawei bereits mit allen drei aspekten der fahrzeugrechenleistung, der cloud-datenskala und der cloud-computing-leistungsskala ausgestattet. von ende dieses jahres bis zur ersten hälfte des nächsten jahres können die end-to-end-algorithmen mehrerer führender automobilhersteller ab der zweiten hälfte des nächsten jahres in großem maßstab eingeführt werden in einem zusammenbruch der end-to-end-massenproduktion und markteinführung.

bedeutet end-to-end „von vorne beginnen“?

die entwicklung und einführung von end-to-end-systemen wird zweifellos eine technologische revolution für die gesamtlösung für intelligentes fahren mit sich bringen. ist es also erforderlich, die bisherige technologie zu stürzen, um in den end-to-end-markt einzutreten?

liu yudong glaubt, dass die ursprüngliche autonome fahrtechnologie nicht vollständig untergraben wird und bestimmte algorithmen und softwareansammlungen durchgängig mit ihr teilen wird.

der erste ist der wahrnehmungsteil. viele end-to-end-front-end-kamera-informationsverarbeitungsteile verwenden jetzt bev-methoden wie backbone oder encoder. der zweite teil ist der regulierungs- und kontrollteil. ein teil des ursprünglichen know-hows in regulierung und kontrolle kann auf das end-to-end-system übertragen werden. der dritte punkt ist die dateninfrastruktur. dies ist eine wichtige fähigkeit, die unternehmen in zukunft für den end-to-end-betrieb benötigen werden. unternehmen, die bev-lösungen implementieren können, verfügen auch über eine relativ starke dateninfrastruktur.

ob es aufgehoben wird, hängt nach ansicht von mao jiming davon ab, wie die bisherige technische lösung aussah. er sagte, dass der end-to-end-kern ein rein datengesteuertes multimodales großmodell sei. wenn die bisherige technische lösung eines bestimmten smart-driving-unternehmens viele regeln habe, würden diese regeln im grunde aufgehoben, wenn die vorherige technische lösung bereits vorhanden sei das meiste davon wurde auf modellgesteuert umgestellt, daher besteht eine hohe wahrscheinlichkeit, dass dieser teil des codes in irgendeiner form wiederverwendet werden kann.

es muss betont werden, dass die durch den end-to-end-algorithmus verursachten änderungen im f&e-modell im fokus jedes oems und jedes autonomen fahrunternehmens stehen und auch der schmerzhafteste ort sind.

wang panqu sagte auch, dass zusätzlich zum modellende noch mehr datenarbeit end-to-end durchgeführt werden muss: erstens müssen das daten-closed-loop-system und seine iterationseffizienz rekonstruiert werden, und zweitens muss end-to-end rekonstruiert werden testen und verifizieren, sensoren der gesamten simulationsplattform. die eingabe muss sehr realistisch sein, was derzeit ein sehr anspruchsvolles technisches problem darstellt. was die arbeitskosten betrifft, sind die gesamtkosten eines durchgängigen intelligenten fahrsystems jedoch niedriger als die eines nicht-ende-zu-ende-systems, da das end-to-end-system nur wenige module enthält , und das kernteam von 20 bis 30 ingenieuren sollte ausreichen.

darüber hinaus wies mao jiming darauf hin, dass sich auch die kostenstruktur intelligenter fahrlösungen von der traditionellen modularen architektur zum end-to-end-modell ändern wird: die arbeitskosten einer großen anzahl von f&e-experten, die verschiedene regeln schreiben, werden verlagert der datenaspekt. dies ist eine gute sache für oems mit möglichkeiten zur massenproduktion. aufgrund der geringeren kosten für die datenbeschaffung werden die gesamtkosten für intelligente fahrlösungen sogar noch deutlich sinken.

in bezug auf die investitionen in rechenleistung sagte lou tiancheng, dass der kauf großer rechenleistungschips kurzfristig tatsächlich die aktuellen kosten erhöhen werde. aber auf lange sicht werden die anfänglichen investitionskosten allmählich verwässert, sobald die end-to-end-technologie ausgereift ist und angewendet wird.

die reine end-to-end-rechenleistungsinvestition ist geringer als die der modularen architektur, die mindestens 100 bis 200 millionen pro jahr beträgt.

„wenn man möchte, dass das end-to-end-modell ein relativ gutes ausbildungsniveau erreicht, muss man mindestens 100 bis 200 millionen rechenleistung pro jahr investieren, und die anzahl der pkw-strecken wird auf jeden fall noch beeindruckender sein.“ ."

laut wang panqu gliedert sich die durchgängig erforderliche rechenleistung in zwei aspekte: schulung und bereitstellung. die bereitstellung entspricht der anzahl der zu erwerbenden domänencontroller. diese kosten sind fest und im verhältnis zu den kosten eines einzelnen fahrzeugs relativ niedrig. der größte kostenfaktor sind die schulungskosten, die sich in zwei arten unterteilen lassen: selbst erstellte und gekaufte karten oder die zusammenarbeit mit cloud-dienstanbietern. für automobilunternehmen mit relativ großen aufträgen ist der bau eigener rechenzentren eine kostengünstige option. für automobilunternehmen mit weniger großen aufträgen oder in der anfangsphase der forschung und entwicklung ist die anmietung von servern bei cloud-dienstleistern jedoch die bessere wahl.

lang „wenn wir nicht 1 milliarde us-dollar pro jahr für die ausbildung ausgeben können, könnten wir im künftigen wettbewerb um autonomes fahren ausscheiden.“

in bezug auf die rechenleistungsskala glaubt lou tiancheng, dass hunderte von gpus mit großer rechenleistung es unterstützen können, wenn es sich nur um ein einfaches end-to-end-modelltraining für autonomes fahren handelt. wenn langfristige investitionen erforderlich sind und eine durchgängige qualität gewährleistet ist, liegt die trainingsrechenleistungsskala jedes autonomen fahrunternehmens im wesentlichen auf dem niveau von tausenden von kalorien, und automobilunternehmen werden mehr investieren.

mao jiming gab konkretere end-to-end-rechenleistungsanforderungen an: das gesamte system erfordert mindestens zwei nvidia orin oder einen einzelnen nvidia thor. er sagte, dass der rechenleistungsbedarf eines reinen end-to-end-systems geringer sei als der gesamtrechenleistungsbedarf einer modularen architektur. allerdings verfügt die massenproduktion von end-to-end-systemen zusätzlich zum hauptsystem häufig über ein bypass-system die anforderungen an die rechenleistung entsprechen im allgemeinen denen der vorherigen modularen architektur.

wang panqu glaubt jedoch, dass die rechenleistung mit der zunehmenden leistungsfähigkeit fahrzeugseitiger computerchips in zukunft kein hindernis für ein durchgängiges onboarding darstellen wird. lou tiancheng vertritt die gleiche ansicht und sagt, dass von der klassischen architektur zur end-to-end-architektur die gesamtzahl der codes erheblich reduziert wird und der durch das end-to-end-neuronale netzwerk verursachte rechenressourcenverbrauch nicht unbedingt erheblich sein wird im vergleich zum bev-modell verbessert.

„der wunsch nach höherer rechenleistung ergibt sich eher aus der verbesserung der modellparameter und der modellleistung als aus der end-to-end-transformation.“ darüber hinaus wies er darauf hin, dass aus der perspektive von end-to-end-landeanwendungen relevante unternehmen sollten mehr darüber nachdenken. das wichtigste ist, wie die vorhandenen chip-computing-ressourcen voll ausgenutzt werden können, um die nutzungseffizienz zu verbessern.