nachricht

dialog mit ideal lang xianpeng: wir sind tesla bereits voraus

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

elon musk, ceo von tesla, startete 2023 eine live-übertragung von teslas intelligenter fahrsoftware fsd v12 – der tesla im video basiert auf der neuesten end-to-end-technologie, und die software hat eine große anzahl von regelcodes der ingenieure gelöscht und stattdessen verwendet der wichtigste neuronale netzwerkalgorithmus. das fahrzeug basiert auf autonomer sicht und neuronalen netzen, um anzuzeigen, wo man langsamer fahren muss, ampeln und alle akteure auf der straße identifiziert und autonome entscheidungen trifft.

diese technologie löste in der folge große diskussionen und interesse bei der industrie, bei technikbegeisterten und sogar bei normalen autokonsumenten aus.

dies ist eine neue runde der paradigmenwiederherstellung für intelligentes fahren. bis heute kristallisieren sich im chinesischen markt viele meinungen heraus:

das aufkommen der end-to-end-technologie hat den startschuss für viele automobilhersteller, die sich mit intelligentem fahren beschäftigen, geebnet. jetzt stehen alle wieder am start und beginnen ein langstreckenrennen in sachen daten- und rechenleistung.

die end-to-end-technologie wird durch starke daten beeinflusst. die erstellung von modellen und die menge der datenerfassung, insbesondere die erfassung effektiver qualitätsdaten, wirken sich auf die schnelle iteration der technologie aus.

auf dem chinesischen markt haben unabhängige autohersteller mit „heimvorteil“ ein weiteres langstreckenrennen um intelligentes fahren begonnen. gleichzeitig gibt es viele meinungen, dass teslas fsd-vorsprung zu diesem zeitpunkt ausgelöscht wird.

dr. lang xianpeng, vizepräsident für forschung und entwicklung im bereich intelligentes fahren von li auto, ist ebenfalls davon überzeugt, dasshinsichtlich der technischen architektur unterscheidet sich die neueste lösung von ideal kaum von der von tesla und liegt sogar ein wenig vorne. da im idealfall ein vlm-modell und system 2 vorhanden sind, verfügt tesla durchgehend nur über system 1.

das end-to-end-modell von li auto ist ein one-model-integriertes end-to-end-modell, das sich geringfügig vom end-to-end-modell anderer automobilunternehmen auf dem markt unterscheidet.

konventionelle end-to-end-technologie verwendet ausschließlich modelle der künstlichen intelligenz und mechanisches selbstlernen, um die wahrnehmungs-, planungs- und steuerungsmodule im intelligenten fahrprozess zu ersetzen, von der visuellen „eingabe“ bis zum intelligenten fahrsystem und der endgültigen steuerung des fahrzeugs . die „output“-seite des fahrens wird vollständig vom modell übernommen. eine reine „end-to-end“-technologie setzt in diesem prozess keine regelbasierten codes mehr und wird zu einer kompletten blackbox.

allerdings richten viele automobilunternehmen auf dem markt, darunter relativ fortschrittliche hersteller wie tesla, huawei und xpeng, immer noch bestimmte zugrunde liegende algorithmen ein, die für die sicherheitsredundanz verantwortlich sind. wahrnehmung und planungssteuerung können relativ unabhängige module sein, und die schnittstellen müssen immer noch manuell definiert und verbunden werden.

das integrierte end-to-end-one-modell soll die wahrnehmungs- und planungssteuerungsmodule zusammenführen. es wird intern idealerweise als system 1 bezeichnet und ist eher wie ein treiber, um end-to-end-entscheidungen schnell umzusetzen.

in der vergangenheit trat bei end-to-end-anwendungen im bereich des intelligenten fahrens häufig das problem einer hohen obergrenze, aber auch einer niedrigen untergrenze auf. tesla, der branchenführer, verlief beispielsweise in kalifornien, usa, sehr reibungslos und verhielt sich ähnlich wie ein menschlicher fahrer. sobald er jedoch ein unbekanntes gebiet betritt, wird er schwer zu erklärende regulatorische entscheidungen treffen.

dies ist einer der nachteile von end-to-end.

der ideale ansatz besteht darin, system 2, das visuelle sprachmodell vlm, einzuführen und einen weiteren schritt nach vorne zu machen.

im idealfall ist das visuelle sprachmodell von vlm das weltweit erste große modell, das erfolgreich auf einem fahrzeugseitigen chip eingesetzt wird und über die fähigkeit verfügt, logisches denken und entscheidungsfindung in komplexen szenarien zu bewältigen.

zusätzlich zu one model end-to-end ist system 2 – vlm ein weiterer satz von modellalgorithmen, die system 1 bei der planung und entscheidungsfindung unterstützen. das auf vlm basierende system 2 kann die fähigkeit bieten, komplexe umgebungen zu verstehen, navigationskarten zu lesen und verkehrsregeln zu verstehen.

lang xianpeng gab dieser kombination eine populärere erklärung: system 1 ist wie ein fahrer und system 2 ist ein fahrschullehrer. system 1 verlässt sich bei der durchführung von operationen vollständig auf seine eigene visuelle wahrnehmung. system 2 muss über einen langen zeitraum wissen ansammeln, um system 1 daran zu erinnern und zu informieren.

zhan kun, ein experte für fortschrittliche algorithmen für intelligentes fahren von li auto, und sein team waren die ersten, die dieses konzept vorgeschlagen haben. er folgt dem beispiel von daniel kahneman, einem kognitionspsychologen und nobelpreisträger, und glaubt, dass das menschliche gehirn über zwei systeme verfügt. das erste system basiert auf erfahrung und intuition, und das zweite system erlernt und akkumuliert wissen.

die beiden systeme dienen dem gesamten idealen intelligenten fahren, wodurch sich die ideale lösung für intelligentes fahren völlig von anderen automobilherstellern unterscheidet.

auf dem us-markt ist tesla fsd führend in bezug auf rechenleistung und daten.

aber auf dem chinesischen markt scheint die ideale strategie darin zu bestehen, eine „china tesla smart driving road“ nachzubauen, um sich weiter vorne zu positionieren.

lang xianpeng sagte: „was chinas trainingsrechenleistung und trainingsdaten betrifft, glauben wir, dass wir zumindest von nun an einen vorsprung vor tesla haben, da tesla in china immer noch einigen einschränkungen hinsichtlich der datenkonformität und der trainingsrechenleistung unterliegt in china gebaut werden.

ideal führt auch ein weltmodellsystem in den datentestprozess ein.

ideal sagte, dass das weltmodell die groß angelegte und schnelle iteration einer neuen generation des intelligenten fahrens von ideal unterstützt, ein automatisiertes ki-fähigkeitsbewertungssystem bereitstellt und rekonstruktionstechnologie verwendet, um die von benutzern angetroffenen problemszenarien in „falsche fragensätze“ umzuwandeln. und nutzt generierungstechnologie, um benutzer in „falsche fragensätze“ umzuwandeln. die beiden technologien stellen sicher, dass falsche fragen bei der modellbewertung nicht mehr falsch gestellt werden, und verfügen außerdem über hervorragende generalisierungsfähigkeiten .

basierend auf der technischen lösung von ideal one model+vlm+world model bringt dies auch eine neue generation von ideal-produkten für intelligentes fahren in eine neue phase des „überwachten autonomen fahrens“.

ideal ist das erste unternehmen, das vlm auf orin-x-chips einsetzt, und der erste automobilhersteller, der eine dual-system-architektur einführt. in china hat ideal bereits ein verkaufsvolumen von fast einer million, was den anteil effektiver daten zwangsläufig erhöhen wird. die aktuelle trainingslaufleistung von li auto hat 2,2 milliarden kilometer überschritten und wird voraussichtlich bis ende 2024 3 milliarden kilometer überschreiten. die aktuelle trainingsrechenleistung von li auto hat 5,39 eflops erreicht und wird voraussichtlich bis ende 8 eflops überschreiten 2024.

allerdings streitet die branche immer noch über die anwendung und die aussichten der end-to-end-technologie – einige denken, dass intelligentes fahren ohne 50 milliarden nicht möglich sei, während andere glauben, dass es zumindest in den nächsten jahren eine end-to-end-technologie geben wird regelbasierte modellalgorithmen und einzelmodulfunktionen werden immer noch parallel sein, reines end-to-end ist immer noch blödsinn.

die testergebnisse der ideal user experience group haben gewissermaßen die aktuelle sinnhaftigkeit dieses weges bestätigt. auf jeden fall war li auto bei diesem schritt führend.

dr. lang xianpeng, vizepräsident für forschung und entwicklung im bereich intelligentes fahren von li auto, und zhan kun, leitender algorithmusexperte von li auto intelligent driving

das folgende ist die abkürzung des austauschs mit dr. lang xianpeng, vizepräsident für intelligente fahrforschung und -entwicklung von li auto, und zhan kun, leitender algorithmusexperte von li auto intelligent driving. das gespräch wurde bearbeitet, ohne die ursprüngliche bedeutung zu ändern:

frage: jeder auf dem markt sagt, dass es sich um eine end-to-end-lösung handelt.

zhan kun:end-to-end ist ein forschungs- und entwicklungsparadigma, das sich auf die ausführung einer aufgabe vom ersten eingabeende bis zum endgültigen ausgabeende bezieht. es wird kein anderes modell verwendet, um die aufgabe abzuschließen der prozess von der eingabe bis zur ausgabe ist end-to-end. solange es dieser bedeutung entspricht, können wir es end-to-end nennen.

jetzt ist das ideale auto ein integriertes end-to-end-modell. nach abschluss der modellinferenz wird die flugbahnplanung direkt zur steuerung des autos verwendet weitere schritte dazwischen. es gibt auch eine end-to-end-methode, die darin besteht, zwei modelle in der mitte aufzuteilen. ein signal wird als brücke zwischen den modellen verwendet. die wahrnehmungsergebnisse werden dann in das kontrollmodell eingegeben. und sie werden zu einem modularen end-to-end-modell kombiniert. dies kann auch als end-to-end bezeichnet werden, aber wir glauben, dass ein solches end-to-end nicht wirklich end-to-end ist . li auto möchte den verlust von zwischeninformationen selbst beheben, wenn in der mitte ein künstlicher informationsverdauungsprozess hinzugefügt wird. daher ist die effizienz möglicherweise nicht so hoch oder die obergrenze der fähigkeiten ist möglicherweise eingeschränkt dass das integrierte ende-zu-ende das wichtigere ende-zu-ende ist.

frage: sind wir von tesla inspiriert? gibt es durchgehende unterschiede zu herkömmlichen modulen?

zhan kun:tesla erwähnte anfang 2023 end-to-end, und musk sagte auf twitter, dass es ein vollständiges modell der direkten fahrzeugsteuerung vom eingang bis zum ausgang verkörpere. alle waren schockiert, als sie diese nachricht sahen, denn sie schlugen diese sache nicht nur vor. im jahr 2016 hatte nvidia ein modell, das end-to-end erwähnte, und veröffentlichte einen artikel, aber der effekt war durchschnittlich und löste nur das problem. in einem besonders einfachen szenario hielten alle angesichts der damaligen rechenleistung und modellgröße diesen weg für undurchführbar.

bis 2023 wird die neue transformatorarchitektur um extrem große rechenleistung erweitert. nachdem tesla sie gebaut hat, könnte es zu einer wiederbelebung eines neuen paradigmas kommen. end-to-end ist nicht das erste, was tesla vorgeschlagen hat, aber es geht in eine eher wachstumsorientierte richtung. nachdem wir dies gesehen haben, denken wir auch intern darüber nach, dass der end-to-end-ansatz wichtiger ist, um die redundanz verschiedener informationen zu reduzieren. beim graphlosen modell nähern wir uns dem modularen end-to-end-modell. wir haben ein wahrnehmungsbezogenes großes modell, das eigentlich ein modulares end-to-end-modell ist. dennoch haben wir festgestellt, dass das end-to-end-modell immer noch regeln benötigt und es immer noch daten gibt, die in module unterteilt sind, und richtlinienaufgaben, die in module unterteilt sind.

dieses mal haben wir in unserer diskussion und konzeption neuer lösungen vorgeschlagen, dass die end-to-end-lösung gründlicher und wesentlicher sein muss. li auto verfügt über sehr umfangreiche daten und wir glauben, dass diese daten uns dabei unterstützen können, gute arbeit zu leisten. daher haben wir uns für eine durchgängig integrierte architektur entschieden, die anspruchsvoller und schwieriger ist. die obergrenze liegt jedoch sehr hoch, ihr nachteil besteht jedoch darin, dass das training des score-moduls, einschließlich datenverhältnis und trainingsmethoden, schwieriger ist viel know-how zum erkunden und ausgraben, aber wir haben uns dennoch entschlossen für den schwierigen, aber richtigen weg entschieden.

frage: viele marken behaupten mittlerweile, führend zu sein, und li auto sagt auch, dass es die erste stufe des intelligenten fahrens erreicht hat. wie ist das durchgängige technische niveau dieser unternehmen auf dem markt zu bewerten?

lang xianpeng:aus technischer sicht ist es für den normalverbraucher egal, ob bilder vorhanden sind oder nicht, end-to-end oder non-end-to-end. im mittelpunkt steht letztlich das produkt und das nutzungserlebnis es, sowie der produktwert. deshalb versuchen wir nicht, mit irgendjemandem zu konkurrieren, sondern hoffen, unseren nutzern bessere produkte und dienstleistungen anbieten zu können. in der vergangenheit wurde hochgeschwindigkeits-noa mit hochpräzisen karten verwendet, und das hochgeschwindigkeits-noa-erlebnis entsprach den bedürfnissen der benutzer. als nächstes haben wir bei der erstellung von stadt-noa viele methoden ausprobiert. eine der sehr einfachen ideen war, karten zur erstellung von stadt-noa zu verwenden. wir stellten jedoch fest, dass es keinen kartenhändler gab, der hochpräzise karten der stadt liefern konnte. sorgen sie für helle bilder. wir glauben jedoch, dass lichtgraphen nicht machbar sind, denn sobald iterative graphen benötigt werden, ergeben sich probleme hinsichtlich der aktualität und der frage, ob sie tatsächlich verwendet werden können. wir können den benutzern nicht das gefühl geben, dass ein ort, der heute verfügbar ist, morgen nicht verfügbar sein wird.

letztendlich haben wir uns entschieden, es einfach ohne bilder zu machen. die bisherige bildlose lösung basierte auf wahrnehmungs-, planungs- und untermodullösungen, die eine große anzahl manueller regeln und tatsächlicher fahrzeugtests umfassten, ganz zu schweigen von der budgetinvestition, die zeitlich sehr schwierig war. wenn sie das modell iterieren und das ganze jahr über verschiedene bedingungen durchlaufen möchten, ist dies nicht innerhalb von ein oder zwei jahren möglich, und benutzer können nicht so lange warten. also sind wir auf die technische end-to-end-architektur + vlm umgestiegen. ich denke, diese technische lösung ist im wesentlichen eine lösung für künstliche intelligenz. sie wurde nicht entworfen, sondern ist von selbst gewachsen.

darüber hinaus habe ich ihnen heute den inhalt des weltmodells vorgestellt. meiner meinung nach ist diese fähigkeit die wichtigste und notwendigste garantie für eine schnelle iteration des autonomen fahrens.eine modelliteration würde eine große menge an fahrzeugen, personen und zeit erfordern, um auf herkömmliche weise getestet zu werden. jetzt verwenden wir jedoch generierungs- und rekonstruktionstechnologie, um die szenen zu sammeln, in denen in der vergangenheit probleme aufgetreten sind, und eine bibliothek falscher szenenszenarien aufzubauen.vor jeder veröffentlichung wurden mehr als 10 millionen testkilometer mit einfachen falschen fragen durchgeführt. dabei handelt es sich um einen effektiven satz falscher fragen und nicht um einen zufälligen test auf der straße. darüber hinaus können wir auch szenarien generieren und szenarien simulieren, bei denen es sich ebenfalls um zig millionen szenariotests handelt. die modelliteration auf diese weise ist jetzt viel zuverlässiger als die ursprüngliche fahrzeug- oder straßentestmethode und kann das ganze jahr über verschiedene szenarien abdecken. das ist unser ansatz. wir wissen nicht, ob andere marken dies tun, aber wir orientieren uns vollständig an den bedürfnissen der benutzer. wir wiederholen die technologie, nicht um der technologie willen, sondern weil diese technologie die bedürfnisse der benutzer wirklich erfüllen und ein besseres produkterlebnis bieten kann, werden wir dies tun.

frage: vor nicht allzu langer zeit hat jemand die idee vertreten, dass „es ohne 50 milliarden unmöglich ist, intelligentes fahren zu machen“.

lang xianpeng:bei 50 milliarden müssen sie beurteilen, ob es sich um eine einmalige oder eine langfristige investition handelt. wie heute erwähnt, investieren wir jedes jahr 1 milliarde us-dollar in forschung und entwicklung für intelligentes fahren. es wird 50 milliarden überschreiten.

die technische end-to-end + vlm-architektur ist ein wendepunkt.früher nutzten wir noch traditionelle methoden für das autonome fahren. ab dieser generation nutzen wir tatsächlich künstliche intelligenz für das autonome fahren. als nächstes besteht bei der forschung und entwicklung des autonomen fahrens der kernwettbewerb darin, ob mehr und bessere daten und die entsprechende rechenleistung zum trainieren des modells vorhanden sind. der erwerb von rechenleistung und daten hängt davon ab, wie viel geld ausgegeben und wie viele ressourcen investiert werden. manche dieser dinge kann man nicht mit geld kaufen, wie zum beispiel trainingsdaten und trainingskilometer. jeder autokonzern hat seine eigenen daten und gibt diese nicht an andere weiter.

eine weitere sache, die investitionen erfordert, ist rechenleistung.unsere derzeitige rechenleistung von 539 millionen eflops wird voraussichtlich bis ende dieses jahres 800 millionen eflops betragen. das sind nicht mehr 1 milliarde yuan, sondern kosten von 2 milliarden yuan, die 2 milliarden yuan pro jahr verbrauchen werden. beim eintritt in die l4-stufe werden das jährliche datenwachstum und das wachstum der rechenleistung exponentiell sein, was bedeutet, dass jedes jahr mindestens 1 milliarde us-dollar (sechs bis sieben milliarden yuan) benötigt werden. und nach 5 jahren muss es weiter iteriert werden. auf dieser ebene wird es sehr schwierig, wenn die gewinne und gewinne eines unternehmens die investition nicht unterstützen können. deshalb müssen wir jetzt nicht darauf achten, wie viele milliarden in das autonome fahren investiert werden, sondern wir beginnen beim wesentlichen und schauen, ob genügend rechenleistung und datenunterstützung vorhanden sind, und schauen dann, wie viel geld investiert werden muss .

frage: wie kann die sicherheit des modells gewährleistet werden, wenn die datenmenge nicht sehr groß ist? sind wir nun konzeptionell gesehen auch eine art „zwei-modelle“?

lang xianpeng:„sicherheit“ ist ein thema, das viel aufmerksamkeit erregt hat, ob es koordinationsprobleme gibt, ob es unabhängige sicherheitsmodule gibt usw. der grund, warum jeder diese probleme hat, liegt darin, dass jeder aus der perspektive früherer nicht-ki-basierter autonomer fahrforschung und -entwicklung denkt. ich bin zum beispiel immer auf einem pferd geritten. er hat mich gefragt, ob das auto einen sattel hat. das liegt daran, dass nicht jeder wirklich verstanden hat, was ki-praktiken sind und was nicht-ki-praktiken. dies ist der erste punkt.

zweitens sagen viele leute jetzt, dass sie ein end-to-end-modell haben, aber das echte end-to-end-modell hängt immer noch von zwei fähigkeiten ab: ob genügend daten vorhanden sind und ob genügend rechenleistung vorhanden ist. andernfalls denke ich, dass es schwierig sein wird, eine echte end-to-end-lösung zu erreichen, da end-to-end ein ki-ansatz ist.

drittens sind die ober- und untergrenzen der end-to-end-fähigkeiten sehr hoch. lassen sie mich eine analogie ziehen. bevor cnn (deep neural network model) herauskam, nutzten alle noch traditionelle methoden des maschinellen lernens, um beispielsweise die uns bekannten bildklassifizierungsaufgaben zu erledigen. aber sobald cnn herauskam, waren sie überwältigt von ihrer über 10-prozentigen verbesserung. was ich zum ausdruck bringen möchte, ist, dass nicht jeder die end-to-end-funktionen wirklich verstanden hat und wir es nicht überstürzen werden, sie internen beta-benutzern zugänglich zu machen.

wenn wir nicht-ki-methoden verwenden, müssen wir viele szenarien im hinblick auf die details der vertikalen steuerung berücksichtigen. auf diese weise müssen wir beim entwerfen von szenenregeln viele bedingungen festlegen, um festzulegen, welche maßnahmen unter bestimmten bedingungen ergriffen werden müssen bedingungen. strategie. aber als unsere erste version des end-to-end-modells trainiert wurde, stellte ich fest, dass es an jeder kreuzung oder unter bedingungen, die eine längskontrolle erfordern, sehr komfortabel wäre. wir haben kein debug für spezielle situationen durchgeführt, es war die fähigkeit des modells, sich selbst zu trainieren. es zeigt sich, dass wir ein großes problem bei der festlegung von regeln haben, da die szenarien zu vielfältig sind und es uns unmöglich ist, regeln für alle szenarien festzulegen. aber wenn wir ki verwenden, um ein end-to-end-modell zu erstellen, werden wir feststellen, dass es diese magische kraft hat. wenn wir ihm daten geben, kann es nicht nur die obergrenze lernen , aber es kann das modell auch erheblich verbessern. die untere grenze der verbesserung. obwohl es immer noch seine eigenen grenzen hat, besteht die art und weise, wie wir es lösen, nicht mehr darin, regeln festzulegen, sondern darin, ihm mehr und bessere daten zur verfügung zu stellen.

ebenso haben wir eine unkomplizierte strategie für das steuermodul. da unser end-to-end-sensoreingang in den flugbahnausgang eingegeben wird und der flugbahnausgang an die lenk- und bremsmodule weitergegeben wird, haben wir beispielsweise eine sicherheitsrichtlinie, wenn eine scharfe 180°-kurve geplant ist. wir werden einschränkungen implementieren, aber es gibt nur sehr wenige ähnliche regeln, die im vergleich zum vorherigen ansatz ignoriert werden können.

gleichzeitig haben wir das endergebnis der sicherheit und die obergrenze der fähigkeiten verbessert. unser ansatz besteht darin, es kontinuierlich mit hochwertigen daten zu versorgen, und es wird definitiv viele sichere fahrgewohnheiten erlernen.

frage: wie kann sichergestellt werden, dass die end-to-end- und vlm-daten sauber sind?

zhan kun:ob end-to-end oder vlm, daten sind das wichtigste, und große modelle legen immer wert auf qualitativ hochwertige daten.unser erster schritt besteht also darin, die datenquellen zu bereinigen.unsere auswahl der fahrdaten ist sehr streng. wir haben für jeden autobesitzer einen internen score, der verschiedene dimensionen umfasst und gewichtet wird, z. b. ob ein fahrverstoß vorliegt, ob die linie zu lange gedrückt wurde, ob der stopp erfolgt ist linie geparkt wurde und ob der fahrvorgang abgeschlossen ist. die besten 3 % der benutzer werden als „erfahrene fahrer“ ausgewählt, basierend auf der bewertung verschiedener indikatoren, z. b. wenn das lenkrad mittelmäßig oder dringend gedreht wird oder wenn sie unbehagen verspüren. bei idealen, großen datenmengen sind die daten, die wir erhalten, immer noch sehr groß. zumindest ist das fahrverhalten gut wenn die daten ende-zu-ende bereitgestellt werden.

auf der zweiten ebene gibt es auch ein screening. in einigen szenarien müssen wir auch die modellproben abgleichen und klassifizieren. außerdem gibt es bewertungsmodelle, bewertungsmethoden und einige regeln kann die daten bereinigen und jeden datentyp in sehr detaillierte tags klassifizieren.

in der letzten ebene werden wir wissen, welche proben während des trainingsprozesses schwer zu lernen sind, und die lernstrategie anpassen, einschließlich der bewussten konstruktion einiger synthetischer daten für verstärkendes lernen und kontrastives lernen. nehmen sie einige anpassungen an den lernmethoden für unsere daten vor, damit unsere gesamten end-to-end-daten und vlm-daten gut überprüft und bereinigt werden und das resultierende modell besser wird. dieser prozess geschieht nicht über nacht.

lang xianpeng:es gibt noch ein weiteres problem, nämlich das problem der schmutzigen daten. unser datenvolumen für das training ist immer noch relativ groß, auch wenn wir später nur sehr kleine schmutzige daten haben, da das ki-fähigkeitstraining keinen makel hat, der den gesamten effekt verunreinigen kann, solange die menge an genauen daten groß genug ist wird ein wenig stören. die daten spielen auch keine große rolle.

frage: in den letzten jahren hat sich der technologiekampf um intelligentes fahren rasant verändert und mehrere große iterationen durchlaufen. wird end-to-end + vlm ein rahmenwerk mit langfristiger vitalität sein?

lang xianpeng:end-to-end + vlm ist eine architektur, die menschliches denken und erkennen simuliert, denn wenn wir künstliche intelligenz betreiben, hoffen wir letztendlich, anthropomorphismus oder menschenähnlichkeit zu erreichen. nachdem ich das buch „thinking, fast and slow“ gelesen hatte, war ich sehr inspiriert und wollte endlich wissen, wie menschen erkennen und denken. wir denken, dass das aktuelle framework für künstliche intelligenz sehr vernünftig ist, und ich freue mich auch sehr, das zu sehen als wir es vorschlugen, begannen viele unternehmen der branche, die vorteile der dual-system-theorie zu erwähnen und versuchen, dies umzusetzen. darüber hinaus kann die dual-system-theorie nicht nur beim autonomen fahren eingesetzt werden, sie ist auch ein paradigma für zukünftige künstliche intelligenz und sogar intelligente roboter. man kann sagen, dass autonomes fahren ein intelligenter roboter auf rädern ist, sein arbeitsumfang ist jedoch die straße. daher denke ich, dass es über gewisse langfristige fähigkeiten verfügt, aber die technologische entwicklung ist endlos. wir werden ein ausgeprägtes bewusstsein für fortschrittliche technologien aufrechterhalten und wenn es neue technologien gibt, werden wir diese auch verfolgen.

frage: ideal ist derzeit der meinung, dass zwischen mir und dem intelligenten fahren von tesla eine große lücke besteht, und wann kann ich aufholen?

lang xianpeng:letztes jahr habe ich geantwortet, dass es weniger als ein halbes jahr war, und dieses jahr könnte es etwas weniger sein. erstens unterscheiden wir uns hinsichtlich der technischen architektur kaum von tesla und sind sogar ein wenig voraus, da wir über vlm und system 2 verfügen, während tesla nur über system 1 verfügt, und zwar durchgängig. zweitens glauben wir, dass wir in bezug auf chinas trainingsrechenleistung und trainingsdaten zumindest von nun an einen vorsprung vor tesla haben, da tesla in china immer noch einigen einschränkungen hinsichtlich der datenkonformität sowie der schulungsbereitstellung unterliegt der rechenleistung muss in china noch aufgebaut werden. aus dieser perspektive ist die kluft zwischen uns in china und tesla möglicherweise nicht so groß. wir hoffen auch, dass tesla mitmachen, voneinander lernen und sich darauf konzentrieren kann, uns zu verbessern.

frage: es gibt die ansicht, dass der ki-weg für intelligentes fahren nicht ganz richtig ist, und ich glaube nicht, dass dieser weg funktionieren kann, da l2 mehr wert auf niedrige kosten oder vielseitigkeit legt, l4 jedoch erst danach universalität erreichen kann sicherheit ist gelöst, also massenproduktion kann das auto l4 sein?

lang xianpeng:erste,wir glauben, dass alles von den benutzerbedürfnissen und dem benutzerwert ausgehen sollte.jedes von li auto hergestellte produkt muss den benutzerwert übertreffen oder erfüllen. wir stellen es nur her, wenn benutzer es wertvoll finden. wir glauben, dass die benutzer eine nachfrage nach autonomem fahren haben müssen, daher ist es für uns unmöglich zu entwerfen, dass benutzer l4 nur in chengdu und nicht anderswo fahren können.

zweitens ermöglicht der progressive oder sprunghafte technische weg jeder marke, ihren eigenen technischen weg zu diskutieren und zu wählen.aber li auto wird definitiv einen technischen weg wählen, der den bedürfnissen der benutzer entspricht.wir entscheiden uns jetzt dafür, künstliche intelligenz für das autonome fahren zu nutzen. früher als „assistiertes fahren“ bezeichnet, unterstützte das system menschen beim fahren, und das thema waren menschen. aber nach der end-to-end + vlm-phase glauben wir, dass das auto selbst fahren wird. nach dem training eines kompletten modells kann das modell das auto gut fahren, wenn es nicht funktioniert oder wenn es hinweise gibt, dass es übernommen werden muss. das thema muss jedoch das auto und die menschen sein wenn es dieses niveau erreicht, wird es die nachfrage der benutzer nach autonomem fahren befriedigen.

frage: hat li auto pläne, für intelligentes high-end-fahren gebühren zu erheben?

lang xianpeng:standard und kostenlos sind beides strategien, die ideal seit dem ersten tag des intelligenten fahrens formuliert hat. „überwachtes autonomes fahren“ ist für alle ad max-besitzer kostenlos. das liefervolumen ist relativ gut und die geschäftstätigkeit des unternehmens ist stabil. es verfügt außerdem über ausreichende ressourcen, um in forschung und entwicklung für intelligentes fahren zu investieren. das liefervolumen ist für uns nicht nur eine frage der liefermenge, sondern kann auch dazu beitragen, dass das auto mehr trainingsmeilen für das autonome fahren zurücklegt.