Wei Xiaoli durchgehend: verschiedene Formen, aber die Freuden und Sorgen sind miteinander verflochten
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Im chinesischen Internet wird Musk oft als „ursprünglicher Gott“ verspottet und verspottet.Tesla„Ohne Open Source wird China nicht in der Lage sein, ein reines Elektroauto zu bauen“, so die länderhassende Partei.Allerdings hat Tesla im Bereich des intelligenten Fahrens tatsächlich lange Zeit eine Vorreiterrolle gespielt, indem es den AI Day veranstaltete, um technische Details auszutauschen (Hinweis: Es kann mehr als einen Vorreiter geben).Doch seit letztem Jahr hat Tesla den AI Day abgesagt und nur noch den technologischen Fortschritt angekündigt und nicht mehr über die technologische Umsetzung gesprochen. Was der Außenwelt überlassen blieb, war die häufige gute Nachricht, dass FSD durchgängige technische Lösungen nutzt. In diesem Jahr öffneten verschiedene Smart-Driving-Unternehmen die von Tesla angebotenen End-to-End-Übungen und fanden plötzlich eine Reihe kleiner Wörter in der Antwortspalte: Lösen Sie das ProblemDer Vorgang entfällt.Wie erstelle ich End-to-End-Antworten ohne Referenz? Wird die Forschung und Entwicklung des durchgängigen intelligenten Fahrens durch ein sinnvolles Geschäftsmodell unterstützt?Die Frage wurde zunächst an Wei Xiaoli gerichtet, den Vertreter der neuen Kräfte im Automobilbau.01
Öffne die Blackbox
Vom letzten Jahr bis zur ersten Hälfte dieses Jahres bestand das Hauptthema des Wettbewerbs unter inländischen Smart-Driving-Spielern darin, mit einer Vielzahl von Menschentaktiken im Rahmen der traditionellen modularen Technologiearchitektur um die Öffnungsgeschwindigkeit der Stadt zu konkurrieren.Während dieses Prozesses wuchs das Smart-Driving-Team von Wei Xiaoli auf tausend Personen (oder mehr), das Tag und Nacht trainierte, testete und verifizierte, um den Corner Case zu meistern.Tesla FSD hat den End-to-End-Effekt nachgewiesen und gibt jedem die Möglichkeit, sich von Doppelarbeit zu befreien.Der Preis besteht jedoch darin, dass jedes Modul des traditionellen Smart-Driving-Technologie-Stacks getestet und verifiziert werden kann, während das End-to-End-Smart-Driving-System eine Blackbox ist, die nur die Ergebnisse, nicht aber den Prozess kennt.Wei Xiaoli bewegt sich in Richtung End-to-End und die gemeinsamen Probleme, mit denen sie konfrontiert sind, sind:In einer Funktion mit hohen Sicherheitsanforderungen wie intelligentem Fahren ist eine vollständige Blackbox nicht akzeptabel. Es muss eine Möglichkeit gefunden werden, diese Blackbox zu öffnen und zu verstehen, „warum das System dies tun möchte“ oder zumindest ihre Ausgabe relativ zu machen kontrollierbar.XiaopengDie Wahl ist eine segmentierte End-to-End-Progressive-Route, und ihre technische Lösung ist das wahrnehmungsbezogene neuronale Netzwerk XNet + das planende neuronale Netzwerk XPlanner + das visuelle Sprachmodell XBrain, das sich auf das Szenenverständnis konzentriert.Xpeng segmentiert End-to-End
In der End-to-End-Technologiekette ist segmentiertes End-to-End derzeit nachgelagert.Radikale glauben, dass segmentierte End-to-End-Lösungen immer noch nicht vom Umfang traditioneller Lösungen abweichen. Obwohl sowohl Wahrnehmung als auch Planung als neuronale Netze implementiert wurden, hat sich ein wichtiger Punkt nicht geändert – die Schnittstelle, die die beiden neuronalen Netze verbindet Eine vom Menschen definierte Schnittstelle bedeutet Informationsverlust und eine große Menge an manuellen Anmerkungen. Der gesamte Prozess ist nicht förderlich für eine globale Optimierung und Automatisierung.Aber auch hier liegen die Vorteile von segmentiertem End-to-End: Es gibt vom Menschen definierte Schnittstellen, was bedeutet, dass Zwischenergebnisse ausgegeben werden, die für den Menschen verständlich sind, was für die Überprüfung und Lokalisierung von Problemen praktisch ist und sich nicht auf den gesamten Körper auswirkt B. bei Erkennungsproblemen. Es ist nicht erforderlich, das gesamte Netzwerk neu zu trainieren. Das gemeinsame Training zweier kleinerer Modelle ist weniger schwierig und verbraucht weniger Rechenressourcen als das Training eines großen End-to-End-Modells.Noch wichtiger ist, dass diese Methode theoretisch einfacher ist, die Untergrenze der intelligenten Fahrleistung einzuhalten.Am 30. Juli, nach der Einführung des XNGP Smart Driving von Xpeng, das landesweit vollständig geöffnet wurde, sagte He Xiaopeng: „Gebäude müssen Schicht für Schicht gebaut werden. Es ist möglich, sich sprunghaft zu entwickeln, aber das Risiko wird extrem sein.“ hoch."Dieser Satz wurde als Ermahnung an befreundete Geschäftsleute interpretiert.Anfang Juli stellte Lili auf seiner Sommerkonferenz eine einstufige End-to-End-Lösung vor, die sich in der Entwicklung befindet: 4D One Model End-to-End. In einem einstufigen End-to-End werden Wahrnehmung und Planung in ein neuronales Netzwerk mit Hunderten Millionen Parametern verpackt und Fahrvideos erfahrener Fahrer zu den wichtigsten Trainingsdaten. Diese Lösung unterstützt die verlustfreie Übertragung von Informationen und weist einen höheren Automatisierungsgrad im Datenfluss auf. Sie ist radikaler als die End-to-End-Lösungen von Xiaopeng und Huawei.Allerdings weist diese End-to-End-Lösung Probleme wie schwache Generalisierung, schlechte Interpretierbarkeit und instabile Untergrenzen auf. Aus diesem Grund hat Ideal ein VLM (Vision-Language Model) mit einer Skala von 2,2 Milliarden Parametern angebunden. Endmodell. Großes Modell. Dieses Modell verfügt über ein besseres Verständnis komplexer Verkehrsszenen und Verkehrszeichen und kann als Referenz für End-to-End-Modellfahrentscheidungen dienen und die Leistung intelligenter Fahrsysteme verbessern.IdealEnd-to-End+VLMIntelligente Fahrlösung für schnelles und langsames SystemIm August startete Ideals End-to-End + VLM-Lösung für schnelles und langsames intelligentes Fahren mit zwei Systemen einen internen Test mit Tausenden von Menschen für professionelle Benutzer. Beamte gehen davon aus, dass sie Ende dieses Jahres oder Anfang nächsten Jahres für normale Benutzer eingeführt werden .Zuvor war Ideal nicht führend in der Nutzerwahrnehmung von Zhijia, was sich negativ auf den Umsatz auswirkte (insbesondere gegen).Fragen Sie die WeltStunde). End-to-End + VLM wird idealerweise als ein entscheidender Kampf um die Fähigkeit des intelligenten Fahrens definiert, in Kurven zu überholen und die erste Staffel zu werden.Im Gegensatz,NIOEs nimmt eine konservative und radikale Haltung gegenüber End-to-End ein.NIO ist insofern konservativ, als die derzeitige Nutzung von End-to-End sehr begrenzt ist und es nicht für städtische NoA, sondern nur für aktive Sicherheitsfunktionen verwendet wird. Am 11. Juli begann NIO, AEB mithilfe einer End-to-End-Lösung voranzutreiben, um das Problem der unzureichenden Abdeckung von AEB-Szenarien in herkömmlichen Lösungen zu lösen.Die radikale Seite von NIO besteht darin, dass das intelligente Fahren, das später in diesem Jahr eingeführt wird, bereit zu sein scheint, den derzeit beliebten End-to-End-Onboarding-Trend zu überspringen und direkt zur nächsten Stufe überzugehen: dem Weltmodell-Onboarding.Das Weltmodell ist die neueste Methodik in der Smart-Driving-Branche. Auf der CVPR, der wichtigsten Konferenz für künstliche Intelligenz im Jahr 2023, demonstrierte Tesla die Forschungs- und Entwicklungsergebnisse des Weltmodells Wayve.ai, ein Start-up, das in der Branche für sein Weltmodell für autonomes Fahren GAIA-1 bekannt ist, und sammelte 1 Milliarde US-Dollar Mai dieses Jahres.Durch das Erlernen großer Mengen realer Fahrszenenvideos kann das Weltmodell Fahrszenenvideos innerhalb einer bestimmten Zeit in der Zukunft vorhersagen und generieren, um richtige Fahrentscheidungen zu treffen. Sein Wesen ist die Raum-Zeit-Ableitung. Dies ähnelt dem menschlichen Fahrverhalten. Erfahrene Fahrer werden das Verhalten anderer Verkehrsteilnehmer und Veränderungen im Verkehrsfluss in ihrem Kopf vorhersagen und daraus den Fahrbetrieb planen.Das Weltmodell geht einen Schritt weiter als das aktuelle End-to-End-Modell, da seine Kernaufgabe nicht nur darin besteht, einen geplanten Weg bereitzustellen, sondern auch „die Pixeländerungen der Fahrszene vorherzusagen“. Diese äußerst schwierige Aufgabe wird das Modell nicht nur dazu zwingen, das Verhalten hervorragender Fahrer zu erlernen, sondern auch umfassende Verkehrskenntnisse und Physik zu erlernen.Was Weilai bei NIO IN vorgeschlagen hat, ist ein noch schwierigeres „Weltmodell PLUS“. Es ist komplexer und hat mehr Ausgabedimensionen, was bedeutet, dass es durch Vergleich mit dem wahren Wert mehr Überwachungssignale bilden und das Training neuronaler Daten beschleunigen kann Netzwerken und reduzieren auch den Black-Box-Level des Systembetriebs. Aber der Preis ist ein höherer Entwicklungsschwierigkeitsgrad.NIO-Weltmodell,Es gibt vieleDie Ausgabe der Vorhersageaufgabe von
Als Referenz: Um das Weltmodell GAIA-1 zu trainieren, das nur für Demozwecke verwendet wird und nur geplante Pfade und Videos ausgibt, hat Wayve.ai 4700 Stunden Videodaten verwendet und 15 Tage lang mit 160 Blöcken A100 trainiert. Das Weltmodell, das NIO trainieren möchte, erfordert Daten und Rechenressourcen, die um mehr als eine Größenordnung höher sind.Nach Abschluss des Trainings ist es ein weiteres komplexes Problem, ein komplexes und riesiges Weltmodell zu komprimieren und in Orin-X zu stopfen, das über eine sehr begrenzte Rechenleistung und Bandbreite verfügt und gleichzeitig Genauigkeit und Laufgeschwindigkeit gewährleistet.Gegenwärtig spürt Wei Xiaoli, der zum ersten Mal End-to-End ausprobiert (auch wenn er vorsichtig angenommen wird), die Wirkung von „Erhöhung der Obergrenze und Senkung der Untergrenze“ von End-to-End in unterschiedlichem Ausmaß.Die neueste Version von Xpeng, XNGP, verfügt beispielsweise über beispiellose Kehrtwendefähigkeiten, Rückmeldungen haben jedoch gezeigt, dass die intelligente Fahrleistung bei hohen Geschwindigkeiten nachgelassen hat.Die End-to-End- und VLM-Lösung von Ideal, die derzeit intern getestet wird, weist eine hohe Obergrenze und eine schwankende Untergrenze auf.Das von NIO vorangetriebene End-to-End-AEB hat nicht nur die Leistung, Geistersonden in nicht standardmäßigen Szenen wie toten Winkeln in Kurven extrem zu vermeiden, sondern wurde von Benutzern auch wegen einer Zunahme von Fehlbremsungen kritisiert.02
L4-Forschung und -Entwicklung, L2-Perspektiven?
Wenn die Untergrenze schwer zu erfassen ist, haben sich Automobilhersteller ausnahmslos der End-to-End-Lösung zugewandt, vor allem weil die Obergrenze der End-to-End-Lösung ausreichende Verbesserungen des Benutzererlebnisses und entsprechende Geschäftsmöglichkeiten mit sich bringt.Da sich Automobilhersteller jedoch immer stärker mit dem Thema „End-to-End“ befassen, stellt sich für sie immer noch die Frage: Kann das Input-Output-Verhältnis für intelligentes Fahren berechnet werden?Um mehr FSD zu verkaufen, senkte Tesla im März dieses Jahres seinen Abonnementpreis von 199 US-Dollar pro Monat auf 99 US-Dollar pro Monat (der Kaufpreis sank von 12.000 US-Dollar auf 8.000 US-Dollar). Im Mai dieses Jahres analysierte jedoch eine ausländische Datenberatungsagentur die Kreditkartenzahlungsinformationen von 3.500 Benutzern und kam zu dem Schluss, dass die Umrechnungsrate von FSD nur 2 % betrug, was Musk dazu veranlasste, das Gerücht auf X zu widerlegen, dass „die Umrechnungsrate weit entfernt“ sei bitte mehr als 2 %.Aber weit mehr als 2 % reichen nicht aus. Tesla baut in seinem Werk in Texas einen Supercomputing-Cluster, der voraussichtlich 100.000 H100/H200-Karten erreichen wird. Bei einem Vorzugspreis von 25.000 US-Dollar pro H100 werden allein die Investitionsausgaben für den Kauf von Computerkarten 2,5 Milliarden US-Dollar übersteigen (die Kosten erhöhen). als Rechenzentrum zu bauen und weiter zu betreiben, ist höher) und lohnt sichFSD-Abonnementgebühr für 2,08 Millionen Tesla-Fahrzeuge für ein ganzes Jahr。Noch weniger optimistisch ist das Smart-Driving-Geschäftsmodell inländischer Autokonzerne.Die Forschungs- und Entwicklungskosten von Xiaopeng für KI liegen in diesem Monat bei 1 Milliarde US-Dollar. Allerdings sind sowohl Xpengs XNGP als auch Ideals NOA serienmäßig mit High-End-Modellen ausgestattet kaufen. NIO hat keine kostenlose Strategie verfolgt. Der Preis für die High-End-Smart-Driving-Funktion NOP+ beträgt kurzzeitig 380 Yuan, aber jetzt gibt es bei Neuwagen eine 1-2-jährige kostenlose Nutzungsdauer von NOP+.Einschließlich Tesla befinden sich High-End-Smart-Fahrer im In- und Ausland immer noch in der Phase, in der sie Geld verlieren und Geld verdienen.Der Widerspruch besteht darin, dass diese Unternehmen nach dem Eintritt in den städtischen NOA-Wettbewerb und dem Übergang zum End-to-End-Paradigma die Intensität der Forschung und Entwicklung im Bereich intelligentes Fahren tatsächlich auf autonomes Fahren der Klassen L3 und sogar L4 ausgerichtet haben. Der Mainstream-Markt sieht sie jedoch immer noch Wert als „die zusätzlichen Kosten für die Software nicht wert.“ Bezahltes L2-unterstütztes Fahren.Um diese „Lücke zwischen erwartetem Wert und tatsächlichem Wert“ zu schließen, scheint der Einstieg in den größten L4-Markt für autonomes Fahren, Robotaxi, der vielversprechendste Weg zu sein.Im Jahr 2018 bewertete Morgan Stanley Waymos Robotaxi mit 80 Milliarden US-Dollar. Musks größter Fan, Mu Jie von Ark Investment, gab im Juni dieses Jahres eine Prognose ab, dass der Umsatz von Tesla Robotaxi im Jahr 2029 „konservativ“ 603 Milliarden US-Dollar erreichen wird, was den Marktwert von Tesla bis dahin auf 7 Billionen Dollar steigern wird.Zuvor hatte Musk auf Twitter angekündigt, dass er im August (bereits) ein Robotaxi-Modell auf den Markt bringen werdeauf den 10. Oktober verschoben).03
Die Geschäftsrenditen waren bisher keine WunderOb Robotaxi gemacht werden soll oder nicht, ist dieses Jahr für Wei Xiaoli zu einer heißen Frage geworden.Für Xpeng, das Tesla am nächsten kommt, lautet die Antwort JA. Im Juli gab He Xiaopeng öffentlich bekannt, dass Xpeng Motors im Jahr 2026 Robotaxi auf den Markt bringen wird.He Xiaopeng glaubt, dass die Hardwareanforderungen von Robotaxi weitaus komplexer sind als gedacht, aber die Kombination aus End-to-End- und Softwarealgorithmen für große Modelle, die schnell wachsen kann, reicht aus, um das autonome Fahren der Stufe L4 zu lösen. He Xiaopengs Ziel für das Team ist es, dass das XNGP-Erlebnis in der zweiten Hälfte des Jahres 2025 mit dem Robotaxi von Google Waymo verglichen wird.Allerdings ist der Automobilbau selbst bereits ein vermögensintensives Geschäft, in dem eine große Anzahl von Robotaxi gebaut und betrieben wirdEine selbstfahrende Taxi-Beförderungsplattform wird die Geschäftskette und den Investitionsrenditezyklus unendlich verlängern.Google hat dieses Jahr 5 Milliarden US-Dollar in Waymo investiert, und es ist unmöglich, dass Xpeng so reich ist.Von Juni bis Juli besuchte He Xiaopeng Cheng Wei, CEO von Didi, und Dara Khosrowshahi, CEO von Uber. Er sagte, dass Xpeng kein Robotaxi betreiben wolle, sondern darauf hoffe, Modelle und autonome Fahrtechnologie an globale Partner zu exportieren.Ubers Robotaxi, jetzt Partnerschaft mit Hyundai
Der Ansatz von Automobilherstellern zu End-to-End-Robotaxi hat bei vielen L4-Autonomen-Fahrern Gegenreaktionen hervorgerufen, darunter dem ehemaligen CEO von TuSimple, Hou Xiaodi, dem CTO von Pony.ai, Lou Tiancheng, und dem Präsidenten von Qingzhou Zhihang, Hou Cong. Einige von ihnen kritisierten wütend die End-to-End-Mythologie der Automobilunternehmen, andere sagten, dass die relevanten Fähigkeitssysteme der Automobilunternehmen nicht solide seien, die Kernargumente jedoch dieselben blieben:Obwohl das High-End-Intelligenzfahren von Automobilunternehmen rasante Fortschritte gemacht hat, ist es im Wesentlichen im Rahmen des assistierten Fahrens konzipiert. Die Hauptziele sind Benutzerfreundlichkeit und Kosten, und das Wichtigste für Robotaxi ist Zuverlässigkeit und Sicherheit. Die unterschiedlichen Ziele machen es für beide schwierig, die gleiche Software und Hardware zu verwenden, und es ist für Automobilhersteller schwierig, reibungslos vom High-End-Smart-Driving auf Robotaxi umzusteigen [1][2][3].Das geht Li Bin ins Herz. In einem Interview am 27. JuliEr machte deutlich, dass er „Robotaxi nicht für eine aufregende Errungenschaft oder ein Geschäftsmodell hält“ und sagte wütend:„Der Wert intelligenten Fahrens besteht heute nicht darin, die harte Arbeit von Chauffeuren und Taxifahrern zu eliminieren.“Ein weiterer Grund, warum er in Bezug auf Robotaxi nicht optimistisch ist, ist folgender:Aufgrund begrenzter Straßenressourcen und staatlicher Vorschriften kann Robotaxi nicht unbegrenzt eingeführt werden, was es schwierig macht, ein Geschäftsmodell mit hohen Grenzerträgen wie Software-Cloud-Diensten zu haben.Li Bin hat immer darauf bestanden, dass die Menschen ein eigenes Auto besitzen wollen, daher besteht das Ziel von NIO Smart Driving darin, Fahrern dabei zu helfen, Energie freizusetzen und Unfälle zu reduzieren. Das Schlüsselwort des Geschäftsweges ist Skaleneffekt – der Verkauf von mehr Autos Normalen Benutzern und Benutzern mit ausreichenden Abonnementgebühren werden Abonnementgebühren für intelligentes High-End-Fahren berechnet, wodurch die Kosten verwässert und Einnahmen erzielt werden.Angesichts der hohen Kosten für intelligentes Fahren reicht die kumulierte Benutzerzahl von NIO von weniger als 600.000 jedoch immer noch nicht aus, und der Export von intelligenten Fahrfunktionen ist zu einer Option geworden. Ren Shaoqing, der Verantwortliche für das intelligente Fahren bei NIO, äußerte kürzlich die Bereitschaft von NIO, seine intelligenten Fahrlösungen zum ersten Mal auch anderen Automobilherstellern zugänglich zu machen, ebenso wie NIOs Offenheit für den Batteriewechsel.Im Gegensatz dazu ist Li Xiangs „technisches Urteilsvermögen radikal und die Geschäftsstrategie konservativ“ für Zhijia.Li Xiang hat dieses Jahr auf dem Chongqing Automobile Forum angekündigt, dass die Kombination aus End-to-End + VLM innerhalb von drei Jahren autonomes Fahren auf L4-Niveau erreichen wird. Der Unterschied besteht jedoch darin, dass Ideal nie über das Robotaxi-Geschäft nachgedacht hat. Selbst bisher hat Ideal kein Interesse daran gezeigt, für intelligente Fahrsoftware Gebühren zu erheben. Das Logo auf seiner offiziellen Website lautet immer noch „Smart Driving für alle Szenarien, keine Abonnementgebühren für das Leben“.Dies hängt mit der idealen Wettbewerbssituation zusammen. Im vergangenen Jahr standen sich Ideale gegenüberHongmeng ZhixingDer Umsatz ist erheblich unter Druck geraten. Der schärfste Speer von Hongmeng Zhixing sind die intelligenten ADS-Fahrfähigkeiten von Huawei.In einer Zeit, in der Hongmeng Zhixing mit Huawei ADS 3.0 (Einkaufspreis liegt bei etwa 10.000 Yuan) aus allen Gesellschaftsschichten auf dem Vormarsch ist und Ideal weiter unter Druck setzt, kann das intelligente Fahren AD MAX von Ideal helfen, das einfacher zu bedienen als zuvor, aber kostenlos ist Schnappen Sie sich mehr Mehrfachbestellungen. Im Gegensatz zu Xpeng und NIO besteht der ideale KPI für intelligentes Fahren nicht darin, Betriebseinnahmen zu erzielen, sondern den Umsatz zu bedienen.Da die heimische Automobilindustrie jedoch in die K.-o.-Runde eintritt, kann das Smart-Driving-Geschäft von Wei Xiaoli nicht lange in einem Zustand bleiben, in dem es darum geht, Freunde zu finden.Die Kosten für eine Schulungskarte beginnen bei 100.000 Yuan und die Arbeitskosten für ein tausendköpfiges Team beginnen bei 1 Milliarde pro Jahr. Als eines der teuersten Unternehmen von Wei Xiaoli hat Zhijia einen ressourcenintensiveren Weg eingeschlagen, um Großes zu erreichen Erfolg, aber es ist immer noch voller Unsicherheit, ob es auch die Früchte wundersamer Bemühungen ernten kann.[1] Hou Xiaodi, der vorsichtige, mutige Mann, Jiazi Guangnian
[2] Im Gespräch mit Lou Tiancheng über Robotaxi: „Je leistungsfähiger L2 ist, desto weiter ist es von L4 entfernt“, Tencent Auto
[3] Tesla macht Robotaxi einfach |. Gespräch mit Hou Cong, Mitbegründer von Qingzhou Zhihang, Yunjian Insight