Nachricht

Taxifahrer, keine Panik. Programmierer in der Smart-Driving-Branche werden ihre Jobs früher durch KI verlieren.

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Ist der „GPT-Moment“ des intelligenten Fahrens bereits da?


Autor |. Cao Siqi
bearbeiten|. Jingyu

Jede neue Technologie durchläuft von der Geburt bis zur Einführung unterschiedliche Phasen und wird auch auf unterschiedliche Stimmen stoßen. Um die optimale technische Lösung zu finden, geben Entwickler möglicherweise jahrelange Bemühungen auf, während kommerzielle Organisationen sich mehr auf die Beurteilung des Zeitpunkts der Technologieimplementierung konzentrieren, um den Nutzen zum richtigen Zeitpunkt zu maximieren.

In Bezug auf intelligentes Fahren gab es zwischen inländischen Host-Herstellern einst tiefe kognitive Unterschiede. Befürworter glauben, dass es ein „weit voraus“-Erlebnis bringen kann, während Gegner ihre Verachtung mit Bemerkungen wie „Es ist ein Mist nach Technologie“ und „Autonomes Fahren ist ein Betrug“ zum Ausdruck gebracht haben.

Im Jahr 2024, mit der offiziellen Einführung der FSD V12-Version von Teslas intelligenter Fahrsoftware auf Basis von „End-to-End“, beginnen sich die Einstellungen der chinesischen Autohersteller zum intelligenten Fahren endlich anzunähern.

Am Beispiel von Wei Xiaoli, einem Vertreter der neuen Kräfte im Automobilbau, haben verschiedene Unternehmen offensichtlich damit begonnen, „End-to-End“-Technologie zu verfolgen.

Xiaopeng schlug vor, umfassende End-to-End-Großmodelle in intelligente Fahrsysteme einzuführen, und erklärte, dass es in diesem Jahr 4,2 Milliarden Yuan in Intelligenz und Trainingsdaten investieren werde, mit dem Ziel, in Zukunft „einen internen OTA alle zwei Tage“ zu erreichen. Dies ist eine Effizienzsteigerung, die in der Vergangenheit unvorstellbar war, da Menschen Hunderttausende Zeilen intelligenten Fahrcodes verwalten mussten.

NIO hat kürzlich auch seine Forschungs- und Entwicklungsabteilung für intelligentes Fahren umstrukturiert und die traditionellen Wahrnehmungs- und Skalierungsteams zu großen Modellteams zusammengelegt. Der Kern besteht auch darin, Paradigmeniterationen auf der Grundlage neuronaler Netze zu fördern.

Selbst das Ideal, das früher als „Fabrikkommissionierung“ belächelt wurde, wird in jüngster Zeit häufig genutzt, um Impulse für intelligente Forschung und Entwicklung zu setzen. CEO Li Xiang hat persönlich die „End-to-End“-Forschungs- und Entwicklungsplattform entwickelt und die Schnell-Langsam-Denktheorie der Nobel-Ökonomen eingeführt, um zu veranschaulichen, dass sein Team einen Weg gefunden hat, das schwierige Problem des autonomen Fahrens zu lösen.

Warum ist es also so magisch, verschiedenen Herstellern den Übergang vom Nicht-Konsens zum End-to-End-Konsens zu ermöglichen? Wie hat es das Paradigma der intelligenten Fahrbranche verändert und welche Chancen und Anpassungen wird es mit sich bringen?

01

Der GPT-Moment für intelligentes Fahren ist gekommen

Ein wichtiger Grund, warum inländische Hersteller schnell einen Konsens erzielten, ist, dass Tesla die Führung bei der Bereitstellung eines beneidenswerten End-to-End-Antwortbogens übernommen hat.

Im März dieses Jahres brachte Tesla offiziell die Version 12.3 der intelligenten Fahrsoftware FSD auf den Markt. Die größte Änderung in dieser Version besteht darin, die Leistung des gesamten intelligenten Fahrsystems von von Menschen geschriebenem Code auf ein großes KI-Modell umzustellen, das auf neuronalen Netzen basiert. Musk verwendet „Video in to Control out“, um dieses neue Arbeitsparadigma zu beschreiben, das heißt: KI gibt Fahrvorgänge direkt auf der Grundlage der Straßeninformationen aus, die sie „sieht“, was in der Branche oft als „End-to-End“ bezeichnet wird. beenden).

Letzten Monat erlebte He Xiaopeng die FSD V12.3.6-Version in Kalifornien. In seinen Worten bewältigt FSD „viele Straßenverhältnisse sehr reibungslos.“ Dies ist der größte Vorteil von neuronalen KI-Netzen im Vergleich zu codegesteuerten Netzen: Sie können die allgemeinen Lernfähigkeiten intelligenter Fahrsysteme in verschiedenen Städten und unter unterschiedlichen Straßenbedingungen erheblich verbessern.

Übersetzt in eine Werbe- und Marketingformel, die einheimischen Verbrauchern besser bekannt ist, heißt es: Es kann landesweit (weltweit) geöffnet werden.


Huawei hat im September letzten Jahres den Slogan „Landesweit verfügbar“ eingeführt | Quelle: Geek Park

Natürlich ist diese Schlussfolgerung zum jetzigen Zeitpunkt nur ein guter Wunsch. Im eigentlichen Betriebsprozess ist außerdem die vollständige Segnung und Schulung der KI-Infrastruktur wie Daten, Algorithmen und Rechenleistung erforderlich, um dem Ziel „KI wird so intelligent wie menschliche Fahrer“ nahe zu kommen.

Aber für Kollegen bedeutet die FSD V12-Version viel. Es beweist, dass neuronale Netze tatsächlich von Menschen geschriebenen Code ersetzen und ihn sogar besser und effizienter machen können.

Das bedeutet, dass Sie nicht N Jahre warten müssen, sondern der ChatGPT-Moment in der Branche des intelligenten Fahrens tatsächlich gekommen ist. Denken Sie darüber nach, was Ali Zhang Yong einmal gesagt hat: Es lohnt sich, jede Software mit KI zu überarbeiten. FSD V12 hat seinen Mitbewerbern eine neue Richtung und Selbstvertrauen gegeben: Alle Smart-Driving-Technologie-Stacks können komplett überarbeitet werden.

Als die Betaversion von FSD V12 veröffentlicht wurde, sagte Musk, dass diese Version die 300.000 Codezeilen der Vorgängerversion auf 2.000 Zeilen komprimiert habe, was weniger als einem Prozent entspreche.

Der Smart-Driving-Wettbewerb im neuen Technologie-Stack wird sich nicht zu mehr Anti-Innovations- und Involutionsspielen entwickeln als jeder andere. Wenn die Effizienz der KI wirklich das erreichen kann, was laut He Xiaopeng ein interner OTA alle zwei Tage ist, dann kann die menschliche Taktik, Regeln einzeln zu schreiben und Fehler zu beheben, für völlig überholt erklärt werden.

Braucht die Smart-Driving-Branche also noch so viele Programmierer? Der Autor kann keine genaue Antwort geben, aber sicher ist, dass auch die Arbeitsinhalte von Smart-Driving-Programmierern eine Reihe von Änderungen erfahren werden. Programmierer, die nur If-Andere-Regeln schreiben können, werden höchstwahrscheinlich früher durch KI ersetzt als Taxi- und Online-Ride-Hailing-Fahrer.

02

in Daten gefangen

Im letzten Monat vom Investmentinstitut Chentao Capital veröffentlichten „End-to-End Autonomous Driving Industry Research Report“ äußerten nur 13 % der mehr als 30 Befragten in der autonomen Fahrbranche eine relativ vorsichtige „abwartende“ Haltung gegenüber dem Ende -to-End-Technologie, und der Rest äußerte eine positivere Einstellung der „Vorforschung“ oder sogar des „vollen Engagements“. End-to-End ist unter Branchenpraktikern zum Konsens geworden.

Tatsächlich gibt es jedoch derzeit kein Unternehmen (einschließlich Tesla), das einen „End-to-End-Fundamentalismus“ erreichen kann. Das heißt, alle Aspekte des autonomen Fahrens sind in demselben großen Modell konzentriert, um wirklich die gleichen „visuellen Eingabesignale und Pedal- und Lenkradbetätigungen“ wie Menschen zu erreichen.

Die Hauptbemühungen der meisten inländischen OEMs in dieser Phase bestehen darin, die Wahrnehmungs- und Entscheidungsmodule zu öffnen. Der Schlüssel dazu besteht darin, die manuelle Definition von Ergebnissen zwischen Modulen abzuschaffen und Merkmalsvektoren zu verwenden, um verlustfreie Informationen zu übermitteln.


Schematische Darstellung der Architekturentwicklung des durchgängig autonomen Fahrens |

Vor der End-to-End-Architektur stammte die traditionelle autonome Fahrarchitektur aus dem Bereich der Robotik und war in verschiedene Module wie Wahrnehmung, Planung und Steuerung unterteilt. Verschiedene Module werden von verschiedenen Teams entwickelt und Informationen werden hauptsächlich über manuell definierte Schnittstellen zwischen Modulen übertragen. Um das einfachste Beispiel zu nennen: Das Phänomen, ob ein Fahrzeug über die Linie fährt, kann im traditionellen Wahrnehmungsmodul mithilfe der einfachsten binären Computersprache dargestellt werden.

Der größte Vorteil der Öffnung der Wahrnehmungs- und Entscheidungsmodule besteht darin, dass mehr „Graustufenszenen“ abgedeckt werden können, die durch Regeln in der realen Welt nicht genau beschrieben werden können. Wenn Sie beispielsweise fahren, müssen Sie nicht die genaue Geschwindigkeit des vorausfahrenden Autos kennen oder wissen, ob es die Linie überquert. Sie müssen nur auf die relativen Positionsänderungen achten.

Auf dieser Grundlage, basierend auf der Theorie der generativen KI, wird erwartet, dass das neuronale Netzwerkmodell nach einer großen Menge an Eingaben auch Intelligenz generieren und zu einem KI-Agenten werden kann.

Die Grundlage all dessen sind Daten, also das Trainingsmaterial, das dem Modell „gefüttert“ wird. Im Gegensatz zu großen textbasierten Sprachmodellen ist es für intelligente Fahrmodelle jedoch nicht einfach, genügend öffentliche Videodaten als Schulungsmaterial zu finden.

Der oben erwähnte „End-to-End Autonomous Driving Industry Research Report“ zeigt, dass der größte öffentliche Datensatz derzeit nur 1.200 Stunden Daten umfasst. Laut Musk investierte Tesla im Jahr 2023 fast 40.000 Stunden Videoschulung in die frühen End-to-End-Phasen.

Im Vergleich zu anderen Autokonzernen liegt der Hauptvorteil der Daten von Tesla in der großen Zahl an Massenautos.

Derzeit hat Tesla weltweit mehr als 6 Millionen Fahrzeuge ausgeliefert. Unter den neuen Kräften Chinas, die aktiv intelligentes Fahren einsetzen, beträgt die Anzahl der in Massenproduktion hergestellten Fahrzeuge jedoch nur einen Bruchteil der von Tesla. In Verbindung mit der konsequent minimalistischen SKU und der vollständig vorintegrierten Smart-Driving-Hardware wird die Datenerfassung einfacher.

Die bisherige gängige Praxis in China beruhte meist auf der manuellen Erfassung von Straßeninformationen. Um ein intelligentes End-to-End-Modell zu trainieren, ist es jedoch auch notwendig, genügend Daten aus Edge-Szenarien (Conner-Fällen) abzudecken. Da das Auftreten von Randszenen sehr zufällig ist, haben einige Hersteller angegeben, dass nur etwa 2 % der begrenzten Daten allein durch manuelle Datenerfassung gewonnen werden können.

Darüber hinaus verfügen inländische Hersteller im Vergleich zu Tesla häufig über komplexere SKUs. Zwischen verschiedenen Modellen müssen aufgrund von Unterschieden in der Fahrzeuggröße, der Sensoranordnung usw. auch die relevanten Parameter im Modell neu ausgerichtet werden.

Am Beispiel der Huawei-Serie hat Hongmeng Zhixing im vergangenen Jahr starke Terminal-Vertriebsfähigkeiten bewiesen. Für verschiedene Marken und Modelle von Huawei-Auto-BU-Diensten werden jedoch nach der End-to-End-Implementierung noch Ingenieure benötigt Ausrichtungs- und Lieferarbeiten. Dasselbe gilt für Weilai, das über zwei Marken und neun Modelle verfügt. Sie haben das Integrationsteam in das Lieferteam umstrukturiert.


Nach der Veröffentlichung von Sora twitterte Musk, dass Tesla KI verwendet, um das Fahren in der realen Welt zu simulieren |

Es besteht die Ansicht, dass die von Sora vertretenen Wensheng-Videoprodukte zur Materialquelle für End-to-End-Modelle werden könnten. Aber selbst für Musk ist das Training von KI mit KI-generierten Inhalten noch nicht öffentlich anerkannt. Schließlich sind Daten zu wichtig für das Modelltraining. Wissen Sie, Musk, der immer äußerst geizig war, was die Arbeitskosten angeht, hat in New York auch ein Team von 1.000 Leuten eingestellt, um Teslas Straßenvideodaten zu kommentieren.

03

Lassen Sie sich von Musk nicht „in den Graben führen“.

Es hört sich so an, als wäre der Übergang zu End-to-End eine natürliche Sache, aber 300.000 Codezeilen zu löschen und die bisherige Organisationsstruktur abzubauen und neu zu organisieren, ist definitiv keine leichte Entscheidung. Tatsächlich hat sogar Musk diesen Weg zufällig eingeschlagen. Der Ingenieur, der ihm Ende 2022 zum ersten Mal vorschlug, ChatGPT zu lernen, um ein intelligentes neuronales Fahrnetzwerk aufzubauen, wurde nach der Übernahme von Twitter fast von Lao Ma versetzt, um andere Probleme zu lösen.

Nach dem Training des End-to-End-Modells muss auch das entsprechende Supportsystem (inkl. Rechenleistung etc.) effizient genug sein. In einem Interview mit „Tencent Deep Web“ sagte Ren Shaoqing, Vizepräsident für Forschung und Entwicklung im Bereich intelligentes Fahren bei NIO, dass das Erzwingen von End-to-End-Diensten ohne grundlegende Fähigkeiten dem Einsatz von „Gift“ gleichkäme.

Er sagte: „Wenn Ihre ursprüngliche Codestruktur klar genug ist, beträgt Ihr (Debug-)Testvolumen möglicherweise nur 1 %. Früher haben Sie drei Tage gebraucht, um 1 % erneut zu testen, aber jetzt tut es mir leid, Sie müssen 100 % erneut testen in drei Tagen. Ihr Datenüberprüfungssystem muss also effizient genug sein.“

Aber lassen Sie sich von Tesla nicht direkt in die Irre führen. End-to-End beweist im Moment nur, dass es die Möglichkeit hat, die Arbeitseffizienz zu verbessern, aber es beweist nicht, dass es die ultimative Lösung für autonomes Fahren ist.

Dies steht im Einklang mit dem Verständnis der Branche, ob das Skalierungsgesetz zu AGI (Allgemeine Künstliche Intelligenz) in der physischen Welt führen kann: Es ist sicher, dass generative künstliche Intelligenz eine höhere Intelligenz haben kann, aber ob sie physikalische Gesetze verstehen und automatisch für Anwendungen im Autofahren sorgen kann , Robotik und anderen Bereichen gibt es in der akademischen Gemeinschaft keine Regeln. Im „End-to-End Autonomous Driving Industry Research Report“ glaubt mehr als die Hälfte der Praktiker nicht, dass End-to-End die ultimative Lösung für autonome Fahrtechnologie ist.

Für OEMs, die ihre eigenen intelligenten Fahrfunktionen entwickeln, besteht der pragmatischste Ansatz in dieser Phase darin, sich auf eine durchgängige Implementierung der intelligenten Fahrfunktionen so schnell, einfach und kostengünstig wie möglich zu verlassen. Bei einem Smart-Driving-Software-Abonnement kann die Fahrt länger dauern. Denn auf dem chinesischen Markt verkauft sich Hardware oft besser als Software und Dienstleistungen.

Natürlich besteht eine hohe Wahrscheinlichkeit, dass nicht viele Menschen wie Musk zu innovativen Spielern werden wollen. Wenn man ein gutes Low-Cost-Modell ohne Forschung und Entwicklung stehen lässt und eine große Wette auf Robotaxi eingeht, wird der Marktwert bei einer Verzögerung der Veröffentlichung um Hunderte Milliarden Dollar sinken. Normalere Spieler hoffen einfach, dass die Ausstattung mit einer durchgängigen intelligenten Fahrsoftware dazu beitragen kann, dass sich die Hardware besser verkauft. Wenn es teurer verkauft werden kann, wäre das natürlich das Schönste.

*Quelle des Headerbildes: Visual China

Bei diesem Artikel handelt es sich um einen Originalartikel von Geek Park. Für einen Nachdruck wenden Sie sich bitte an Geek Jun auf WeChat geekparkGO

Geek fragte

Die Rolle von Programmierern in der Zukunft der intelligenten Fahrbranche,

Welche Änderungen könnten auftreten?

16. Juli. Lei Jun hat gepostet: Am 19. Juli, diesen Freitagabend, um 19 Uhr werde ich die 5. Jahresrede von Lei Jun halten. Das Thema ist „Mut“ und ich werde über die Besonderheiten des Autobaus und die Höhen und Tiefen sprechen die letzten drei Jahre.

Liken und folgenGeek Park-Videokonto