Nachricht

Gespräch mit NIO-Mitarbeiter Nr. 001 Li Tianshu: Die KI in „Her“ wird zuerst in Ihrem Auto implementiert

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

„Du machst Nomi und ich werde es so schnell wie möglich in Stücke zerschmettern.“

Im Jahr 2015 hatte die Welt die KI-Technologie, die viele Menschen heute mit „AGI“ assoziieren, noch nicht gesehen, sie war jedoch gerade erst gegründet wordenNIOIn seinem zweiten Jahr hat Li Bin beschlossen, KI-Assistent im Auto zu werden:

Es muss eine eigene physische Einheit haben und superintelligent und empfindungsfähig sein.

Später wurde dieser kleine Ball in der Kernposition von NIOs Cockpit „platziert“ und wurde zu einem der bekanntesten Symbole von NIO – es gibt viele neue Energiefahrzeuge mit großen Bildschirmen oder mehreren Bildschirmen, aber es gibt einen. Der einzige Mensch mit dem „ „Der kleine Ball“, der dir zuzwinkert, könnte NIO sein. Dieser intelligente Assistent ist in Li Bins Augen auch ein Symbol für die ultimative Form von Autos.

Doch als er diese Idee einem leitenden Automobilingenieur eines traditionellen Herstellers erzählte, erhielt er zunächst eine verärgerte Antwort.

„Das ist verständlich. Das ist eine Auswirkung auf das gesamte traditionelle Automobilsystem, an das er gewöhnt ist“, sagte mir kürzlich Li Tianshu, Vizepräsident von NIO. Er ist NIOs Mitarbeiter Nr. 001 und er ist auch die Person, die vom ersten Tag an die Verantwortung übernommen hat, Nomi Wirklichkeit werden zu lassen, nachdem Li Bin sich dazu entschlossen hatte. Natürlich ist er auch derjenige, der diese traditionellen Ingenieure „davon abhalten will, Nomi zu zerschlagen“.

Li Tianshu auf NIO IN

Im Jahr 2015, als die Einführung eines großen Bildschirms in einem Auto noch neu war, galt der Einbau eines runden KI-Roboters ins Cockpit allgemein nicht als gute Idee. Aber Li Tianshu war der Meinung, dass dies getan werden musste. Am Vorabend der Gründung von Weilai trat er dem Team von Li Bin bei. Er ist gerade von seinem Studium in den Vereinigten Staaten zurückgekehrt und hat sich von einem professionellen Ingenieur, der sich mit Automobilmotoren beschäftigt, zum heutigen Vizepräsidenten und Leiter der Produkterfahrung bei NIO entwickelt. Er ist verantwortlich für das intelligente Cockpitsystem NIO, Erfahrung im Produktdesign, die Kombination von Software und Hardware sowie die Einführung von KI-Technologien wie den neuesten Großmodellen.

Unter ihnen ist Nomi eines der wichtigsten Projekte, für die er in den letzten 10 Jahren bei Weilai verantwortlich war. Von der einfachen Drehung des Kopfes nach links und rechts zur Begrüßung der Benutzer zu Beginn bis hin zu den Leistungsaktualisierungen, die Nomi durch die große Technologieinnovation von ChatGPT im Jahr 2023, der KI-Begleiterszene, die Li Tianshu für Nomi vorgesehen hatte, mit sich brachte Die Vergangenheit ist heute ein beispiellos heißes Thema.

Beim zweiten Innovations- und Technologietag von NIO IN am 27. Juli 2024 stellte Li Tianshu das neue NomiGPT vor, bei dem es sich um die neue Architektur von Nomi in Kombination mit Großmodelltechnologie handelt. Es ist auch Teil des neuen intelligenten Banyan3-Systems von NIO. In seiner Rede stellte er die sechs Agenten von Nomi und ihre Einsatzszenarien vor: Parkassistent, Wachübersicht, Service Butler, Discovery, Reiseerinnerungen und NOMI DJ.

NIO IN, das zum zweiten Mal stattfand, wurde von Li Bin auch als der Eingang für die Außenwelt beschrieben, um NIO wirklich zu verstehen:

„Wir wurden schon immer missverstanden. Tatsächlich ist Technologie das Fundament von NIO.“

NIO veröffentlichte außerdem mehrere technische Errungenschaften und Produktaktualisierungen auf einmal. Von der erfolgreichen Veröffentlichung von NIOs NX9031, dem weltweit ersten 5-Nanometer-Chip für intelligentes Fahren, über SkyOS Tianshu, das erste vollständig selbst entwickelte Fahrzeugbetriebssystem eines chinesischen Automobilherstellers, bis hin zum intelligenten System Banyan3, das für KI entwickelt wurde Welt des autonomen Fahrens Modell NWM verfügt über eine riesige Menge an Informationen.

Nomi dient weiterhin als Kontaktstelle zwischen NIOs verborgenen Technologien hinter den Kulissen und Benutzern und ist auch der Inbegriff der Produkt- und Technologieideen des Unternehmens sowie seiner Technologieforschungs- und -entwicklungsmethodik.

Kürzlich hatte ich die Gelegenheit, mit Li Tianshu über seine Erfahrungen bei NIO und die technische Philosophie und technischen Praktiken von NIO bei Produkten wie Nomi zu sprechen.

Heutzutage, wo alle auf der Suche nach Top-Modellen sind und verrückt nach KI-Hardware aller Art sind, scheinen KI-Assistenten in Autos eine vernachlässigte Ecke zu sein. Li Tianshu glaubt, dass die KI in Her eher in Autos implementiert wird.

Das Folgende ist eine Abschrift des Gesprächs.

1

Die Mensch-Computer-Interaktion sei „sehr, sehr wichtig“ und einer der Ausgangspunkte für die Produktdefinition von NIO

F: Wie wurden Sie Mitarbeiter Nr. 001 von NIO? Was haben Sie in den letzten 10 Jahren bei NIO gemacht? Wie sind Sie vom Automobilingenieur zum Verantwortlichen für die Benutzererfahrung geworden?

A: Das erste Mal, dass Bruder Bin und ich uns trafen, war im Jahr 2009. Ich war Student im zweiten Jahr an der Beihang-Universität und habe es geliebt, herumzualbern. Ich gehöre zu den wenigen Menschen, die sich entschieden haben, eine Hochschule mit Luftfahrthintergrund zu besuchen, um Automobiltechnik zu studieren.Weil ich denke, dass der Motor das Herzstück des Autos ist und der Flugzeugmotor einfach der großartigste istBMWRolls Royce Damals wurden Flugzeugmotoren gebaut. Ich denke, das sollte der richtige Ort sein. Aber ich fühlte mich im College unzufrieden und wollte komplettere Autos bauen, weil ich Autos seit meiner Kindheit geliebt habe. Ich hatte also auch Nebenfächer in Industriedesign, Automobiltechnik, Fahrzeugtechnik usw.

Am Ende stieß ich dann zufällig auf einen besonders umfangreichen Wettbewerb, bei dem Studenten einen solchen Formel-Rennwagen bauten. Er unterschied sich relativ klar von den Massenautos auf der Straße, basierend auf Geschwindigkeit, Regeln und Leistung und es war ein Wettbewerb für College-Studenten, bei dem es darum ging, Probleme aus Effizienzgründen zu lösen. Damals stellten Bruder Bin und die Gesellschaft das Formula-Student-Projekt aus dem Ausland vor. Damals war ich als Studierendenvertreter beim ersten Launch dabei. Ich habe Bruder Bin vom unteren Ende der Bühne aus beobachtet.

Unsere Gruppe galt als die erste Gruppe von „Studenten, die Autos bauen“ in China. Bevor die neuen Kräfte Autos bauten, gab es noch eine Gruppe von Studenten, die gebeten wurden, Autos zu bauen (lacht).

Damals meldete ich mich ehrenamtlich und begann, Spiele zu sammeln. Laden Sie alle älteren Doktoranden ein, zusammenzuarbeiten, und ich werde der Kapitän sein. Ich habe ein Jahr lang als Junior gearbeitet und dabei die Entwicklung und den Zusammenbau von Motoren sowie das Testen elektronischer Steuerungen übernommen. Diese Aufgaben wurden von Leuten aus verschiedenen Hauptfächern und Abteilungen übernommen.

F: Studenten bauen tatsächlich Autos. Ihr Projekt ist wie eine Miniautofirma.

A: Ja, es handelt sich tatsächlich um einen Kleinwagenhersteller. Dieser Wettbewerb dauert seitdem an und nach 2020 werden rein elektrische und fahrerlose Technologien eingeführt, und Software wird nach und nach zum Kernwettbewerb werden. Dann werden Sie feststellen, dass viele der wichtigsten Forschungs- und Entwicklungsmitarbeiter und Designer in unserem Unternehmen heute, einschließlich derjenigen an vorderster Front, tatsächlich Leute sind, die aus dem von Bruder Bin finanzierten Formula Student-Rennsystem stammen.

F: Im Jahr 2009 war Weilai noch weit entfernt.

A: Ja. Zu dieser Zeit war er noch in Yiche und die gesamte Finanzierung erfolgte im Namen von Yiche. Später, im Jahr 2011, schloss ich mein Studium ab und ging an die University of Michigan, Ann Arbor, um Automobiltechnik und -fertigung zu studieren. Ich hoffte, an den Geburtsort der Automobilmontagelinie zu gehen, um Fahrzeugherstellung und Systemtechnik zu erlernen. Später kehrte ich nach China zurück und arbeitete ein Jahr lang als Automobilingenieur bei einigen Automobilunternehmen in Shanghai und Peking.

Aber ich fand, dass das für mich nicht genug war. Ich denke, es ist zu weit von der Verbrauchernachfrage entfernt. Oft werden Sie sich fragen, warum Sie das tun? Ist es richtig, dass jeder zu diesem Schluss kommt? Kann nicht antworten.

Deshalb hatte ich damals vor, ein Unternehmen zu gründen und ein kleines Projekt ähnlich wie Autos und das Internet durchzuführen. Vereinfacht ausgedrückt geht es darum, herauszufinden, ob es algorithmenbasierte Empfehlungen für Verbraucher geben und das für Sie am besten geeignete Auto empfehlen kann, basierend auf den Bedürfnissen und Vorlieben aller an ein Auto. Damals dachte ich sofort an Bruder Bin und wollte ihn für eine Finanzierung finden. Er hörte mir eine halbe Stunde lang zu und war auch für mich sehr überraschend Das Projekt ist in Ordnung, aber du bleibst einfach (lacht).

Er gab mir einen Monat Zeit, um darüber nachzudenken, ob ich ihn bei der Vorbereitung seines Autobauprojekts begleiten sollte. Aber Sie wissen auch, dass es im Jahr 2014 viele Leute gab, die sagten, sie wollten Autos bauen, aber nur wenige, die wirklich zuverlässig waren. Damals war ich wirklich hin- und hergerissen, ob ich Projekte wie unseres weiterführen oder mit Bruder Bin an etwas Ungewissem und Unbekanntem arbeiten sollte. Aber damals war ich fest davon überzeugt, dass mein Lebensideal darin bestand, meine eigene Marke zu gründen und mein eigenes Auto zu bauen. Man kann also sagen, dass Bruder Bin dieses Ideal früher als geplant verwirklicht hat.

F: Mit anderen Worten: Ihre unternehmerische Idee war das Ergebnis der damals begrenzten Ressourcen, aber das ultimative Ziel ist es, irgendwann eine eigene Automarke zu besitzen.

A Ja, was mich am meisten beeindruckt, ist nicht der eigentliche Bau eines Autos durch De-Engineering und Produktisierung. Das Wichtigste ist, dass Bruder Bin damals eine Marke schaffen wollte, eine völlig neue Marke. Ich glaube, dieser Punkt hat mich besonders berührt. Später hatten wir weitere Kontakte und schlossen uns 2014 schließlich dem ersten Team des Unternehmens an.

F: Der offizielle Gründungstermin ist September.

A: Ich habe im August mit ihm gesprochen.

F: Sie haben ihn also zufällig getroffen. Damals dachte Li Bin darüber nach, selbst Weilai zu werden.

A: Ja, nur dieser eine Schritt, das gilt als die Spitze dieser Welle. Es ist wahrscheinlich ein Zufall.

F: Ihre Erfahrung hier ist die Geschichte einer Person, die schon seit langem von Autos besessen ist, aber wie sind Sie heute dazu gekommen, eine verantwortliche Rolle für das Produkterlebnis zu übernehmen und über KI zu sprechen?

A: Es fühlt sich völlig unabhängig an, oder?

F: Ja.

A: Tatsächlich hatten Bruder Bin und ich vom ersten Tag an, als wir dem Unternehmen beitraten, ein ganz klares Ziel: Produkte und Technologie zu kombinieren.

Ich denke, dass wir zur Lösung von Problemen im Automobilbau und bei der Softwareinnovation letztendlich wissen müssen, wie wir Produkte definieren und Benutzerbedürfnisse identifizieren können.

Von Ende 2014 bis Anfang 2015 konzentrierten wir uns zunächst auf die Definition und das Design unseres ersten ES8-Produkts. Damals folgten wir auch Bruder Bin, um das gesamte Team zusammenzubringen, das heißt, alle nutzten die Kraft des gesamten Start-up-Teams, um gemeinsam das Produkt zu definieren, das wir uns ursprünglich vorgestellt hatten.

Meine Aufgabe besteht hauptsächlich darin, die Nutzungsszenarien unserer Nutzer zu untersuchen, Einblicke in sie zu gewinnen und diese in unseren Konsens umzusetzen. Beispielsweise habe ich zu Beginn mit Design- und Technikführern wie Roger Markeson und Chris Thomas zusammengearbeitet, um einen Konsens aller über Ideen und Produktanforderungen zu erzielen.

F: Was haben Sie gemacht?

A: Es gab einige kleine Geschichten aus dieser Zeit. Damals mussten wir einige Innovationen am Auto vornehmen. Im ersten Halbjahr 2015 kehrte ich nach Peking zurück, um diesen Benutzereinblick zu machen. Ich bin gerade zur Überführung von Peking gegangen und habe mit meiner Kamera Fotos von verschiedenen Autos gemacht. Ich habe mehr als 3.000 Fotos gemacht und dann Statistiken zu den Mustern hier zusammengestellt. Ich fand diesen Nachmittag besonders am Samstag, weil es die Zeit war, in der die Leute nach der Rückkehr von einer Selbstfahrertour müde waren, und es auch der schönste Moment war, sodass man in diesem Moment alle am entspanntesten und natürlichsten sehen konnte . Zustand. Damals entdeckte ich mehrere Muster. Da meine Frau und ich zu diesem Zeitpunkt noch nicht verheiratet waren, machten wir uns große Sorgen um die subtilen Gefühle des anderen.

F: Dieser Status wurde an Ihre Benutzerbeobachtung weitergegeben.

A: Ja, es kann also sein, dass es einige Dinge gibt, die man erst in einem bestimmten Lebensalter erkennen kann.

Damals schenkte ich der Person im Copiloten besondere Aufmerksamkeit und stellte fest, dass viele Leute im Copiloten ihre Füße auf dem Armaturenbrett hatten, und viele von ihnen waren Mädchen. Warum machen die Leute das? Tatsächlich macht es Sinn, dass der Co-Pilot nicht fahren muss. Logischerweise besteht für Sie doch keine Notwendigkeit, unsere Co-Pilot-Passagiere mit der gleichen Geste wie den Hauptfahrer zu bestrafen, oder?

Daher denke ich, dass der Fahrgastraum asymmetrisch zu dem des Hauptfahrers sein sollte.

Bis heute haben die SUV-Modelle von NIO immer ein solches asymmetrisches Frontkabinendesign übernommen. Als wir es zum ersten Mal nannten, haben wir damals ziemlich viele solcher Dinge getan.

Der zweite Fall ist tatsächlich die Zusammenarbeit mit Bruder Bin, um die Zukunft der Mensch-Computer-Interaktion in Autos zu definieren. Wir legen großen Wert auf die Mensch-Computer-Interaktion.

In den Jahren 2014 und 2015 gab es bei Weilai zunächst vier Werttreiber. Später, nach einer sehr intensiven Diskussion, fügten wir einen fünften Treiber hinzu, der designorientiert ist. Wir glauben, dass dieses Unternehmen eine wichtige treibende Kraft haben sollte, die designorientiert ist.

F: Was sind die vorherigen vier?

A: Das erste ist der Nutzen für den Benutzer, das zweite ist ein umfassendes Erlebnis, das die Erwartungen übertrifft, das dritte heißt kontinuierliche Innovation und das vierte heißt Systemeffizienz.

F: Der einzige unter diesen Elementen mit dem Wort „Treiber“ ist der Design-Treiber. Ich dachte, die ersten vier könnten Technologie-Treiber sein.

A: Ja. Wir schauen uns einige der großartigsten Unternehmen der Welt an, die vom Design angetrieben werden, sondern auch vom Streben nach Perfektion. Sie basieren alle auf Schönheit und Perfektion und beginnen mit der Perfektion des Benutzers Gefühl.

Was bestimmt diese Dinge? NIO ist eine Marke, die von Natur aus warmherzig, menschlich und emotional ist. Das ist es also, was wir im Jahr 2015 hauptsächlich tun, nämlich die ursprüngliche Vision und Ziele des Unternehmens zu definieren und Einblicke in einige sehr untergeordnete Benutzeranforderungen zu gewinnen. Gleichzeitig werde ich auch etwas von Bruder Bins Fantasie über Batteriewechsel und Stromversorgung sehen. Der Höhepunkt ist also unser Produkt der ersten Generation ES8.

Von 2017 bis 2019 war dann meine zweite Etappe bei NIO. Damals wollten wir das Auto verkaufen und begannen 2017 mit dem Aufbau eines Produktmarketing-Teams, unter anderem mit dem Start von Nio Day im Jahr 2017. Im Grunde war ich der Produktdirektor für die Produkteinführungen der letzten Jahre. Im Jahr 2019, das auch die schwierigste Zeit für das Unternehmen war, beschlossen wir, zurückzukommen und die gesamte Planungs- und Definitionsarbeit auf der Plattform der zweiten Generation des Unternehmens durchzuführen.

Ende 2018 reiste ich mit Bruder Bin ins Silicon Valley. Es war das erste Mal, dass ich mit Qiyan (technischer Leiter) unsere neue Architektur, eine zentrale Steuerung und das Konzept der vollständigen Kontrolle vorschlug. Aber die größte Herausforderung ist hier nicht die Hardware, sondern die Software und das Betriebssystem. Mit diesem Betriebssystem ist unser unterstes globales Betriebssystem auf Fahrzeugebene gemeint.

Damals wurde beschlossen, die NT2.0-Plattform der zweiten Generation langsam zu reservieren und in der Vorschau anzuzeigen und SkyOS teilweise nutzen zu lassen. Wenn die NT3.0-Plattform der nächsten Generation vollständig ausgeliefert ist, wird Letao heute und ET9 nächstes Jahr das fahrzeugweite Betriebssystem SkyOS vollständig ausliefern. Alle arbeiteten damals eng zusammen.

Ab 2020 werde ich meine ganze Energie auf das gesamte PD-System (Produktdesign) konzentrieren. Dies ist meiner Meinung nach immer noch eine heilige Position. In vielen Apple-Technologieunternehmen sind Produktdesign und Produktentwicklung tatsächlich sehr wichtig, weil es Benutzer verbindet Wert und technischer Wert. Es kann nicht zur Obergrenze der Technologie werden, noch kann es zur Versklavung der Technologie werden. Das ist sehr kritisch. Daher denke ich, dass das Produktteam ein sehr wichtiges Team und System ist, das das Unternehmen als nächstes aufbauen muss.

Dann dauerte es von 2020 bis 2022 zweieinhalb Jahre, um insgesamt 8 Autos zu planen und zu entwerfen. In Verbindung mit der Vorentwicklung und Vorforschung des NT3 von ET9 war es tatsächlich ein Erlebnis mit sehr hoher Dichte. Wir beschlossen, das gesamte Software-Hardware-Produkt gemeinsam zu definieren, zu planen und zu verwalten. Nur so können die Gene des Produkterlebnisses konsistent sein. Ich denke, dass es bei der Herstellung unserer Produkte und Technologien letztendlich um die Gefühle der Menschen geht.

1

„Wenn dieses Ding fertig ist, möchte ich es als Erstes in Stücke schlagen.“

F: Sie haben erwähnt, dass Sie in den Jahren 2018 und 2019 tatsächlich vier Jobs gleichzeitig ausgeübt haben. Ich kümmere mich um Produktentwicklung, Marketing und Vertrieb und bin auch für das Nomi-Produkt verantwortlich. Ich kann dich also „Vater von Nomi“ nennen, oder?

A: Im technischen Sinne ja, aber im strategischen Sinne ist es definitiv Bruder Bin. Aber es besteht kein Grund zur Sorge darüber, wer der Vater und wer die Mutter ist, hahaha. Natürlich war es Bruder Bin, der dies als Erster vorschlug.

F: Auf Nio IN spielte Li Bin 2017 ein Video der ersten Konzeptversion von Nomi ab. Ich habe mir die Zukunft vorgestellt, die mit Ihnen interagieren und Ihnen helfen kann, einige Verhaltensweisen des Autos zu kontrollieren. Damals war es noch völlig eine Vorstellung von der Zukunft.

A: Ich war auch der Regisseur dieses Videos und habe das Drehbuch selbst geschrieben.

F: Wenn man heute zurückblickt, ist Nomi ein bisschen wie ein Produkt, das schon früh erdacht wurde, und heute hat es endlich die technologische Welle eingeläutet, die es möglich gemacht hat. Wie ist der Prozess?

A : Rechts. Der Grund, warum Bruder Bin mich damals gebeten hat, die Rolle des Produktmanagers von Nomi zu übernehmen, stammt eigentlich aus der Zeit, als diese Idee im Jahr 2015 vorgeschlagen wurde. Aus einer traditionellen Perspektive von Automobilen und Automobildesign werden Sie diese Sache sehr seltsam finden.

F: Gehören Sie zu den Leuten, die es komisch finden?

A: Ich finde es nicht seltsam.

Aber ich sage Ihnen, dass das bei über 90 % der Menschen der Fall ist. Damals gab es einen Satz, der mich zutiefst beeindruckte. Es handelte sich um einen Kollegen, der eigentlich eine sehr erfahrene Person in der traditionellen Automobilindustrie war. Er sagte, wenn dieses Ding gemacht würde,Das erste, was er tun wollte, war, es in Stücke zu schlagen und ihn zu Tode zu schlagen.

F: Wie haben Sie damals beschrieben, dass dieses Ding den Leuten das Gefühl gab, sie würden es zu Tode schlagen?

A :Besonders beeindruckt war ich von unserer ersten Beschreibung. Das erste, woran Bruder Bin dachte, war, dass er sich bewegen kann.

Denn damals stellten sich doch viele Menschen vor, dass sich im Autobildschirm eine KI befände, oder? Sie erzeugen ein kleines Bild auf dem Bildschirm, eine kleine Kugel mit kleinen Augen. Das ist alles machbar. Aber wir wollen wirklich eine Einheit sein.

Dieses Ding macht Sinn, denn wenn es eine Einheit ist, kann es eine Synästhesie mit dem Auto eingehen und die Leute werden erkennen, dass es dasselbe ist. Aber wenn es sich um ein virtuelles Objekt handelt, wenn es sich um einen Avatar handelt, werden die Leute es immer nur als das Ding hinter dem Bildschirm betrachten, das sich möglicherweise in der Cloud befindet, was etwas ganz anderes ist. Wir hoffen, dass das Auto zu einem emotionalen Partner wird, denn NIO ist ein Unternehmen, das ein Benutzererlebnis über den gesamten Lebenszyklus bietet, sodass Entitäten gemeinsam mit Entitäten reisen sollten und nicht mit einer Entität und einem virtuellen Körper. Das ist das Erste, was wir sagen.

Zweitens haben wir auch eine langfristige Idee, denn wir sind relativ emotionale Menschen und können uns so weit einfühlen, dass Menschen am Ende tatsächlich begleitet werden wollen.

Die Leute sagen, sie müssten allein und ruhig sein, aber in Wirklichkeit liegt das vielleicht daran, dass ihnen die Gesellschaft fehlt. Wir glauben, dass Kameradschaft und Verbundenheit, selbst wenn man nur still da ist und nichts sagt, immer noch eine Art Kameradschaft ist, genau wie viele Menschen heutzutage Haustiere halten, oder?

Das Gefühl der Kameradschaft war also ein Wert, auf den wir uns damals konzentrieren wollten. Wenn man es heute betrachtet, ist es tatsächlich eine sehr starke Existenz, auch wenn es nicht spricht. Nur wenn es zu einer Einheit wird, kann es hart genug und stark genug sein. Andernfalls sagen Sie einfach „Stumm“ auf dem Bildschirm.

F: Es ist wirklich weg.

A: Ja, wenn es verschwindet, existiert es nicht mehr. Das ist also eine philosophische Frage, eine existentielle Frage, die es zu beantworten gilt. (Lacht) Wir müssen ihn also existieren lassen und ihm dann eine Bedeutung verleihen.

Die größte Herausforderung bestand damals also tatsächlich darin, alle vom Wert und der Bedeutung dieser Sache zu überzeugen. Dann muss man sich viel Unverständnis erwehren, denn nur wenn man ihn es sehen lässt, wird er es glauben. Die zweite Herausforderung ist die Technologie. Es stimmt, dass alle Sprachbefehle damals interaktiv waren. Tatsächlich hatte er diese Art von Chat heute nicht.

F: Es gibt keine solche Interaktion mit natürlicher Sprache.

A: Ja, es gibt noch keine Interaktion. Wie können wir das jedem glauben machen? Eine weitere größere Herausforderung ist die Technik des Fahrzeugs selbst. Wie kann man diese Dinge im Fahrzeug steuern?

Ich habe damals eine Funktion erstellt, aber einige Autos tun dies möglicherweise nicht mehr. Eine Erfahrung mit dem Auto der ersten Generation ist jedoch, dass Normi ​​auf Sie herabschaut, wenn sich Ihre Hand in der Nähe des zentralen Steuerbildschirms befindet, da wir über einen Näherungssensor verfügen. Sobald Ihr Finger in die Nähe von Nomi kommt, wird dies der Fall sein Senken Sie den Kopf, was bedeutet, dass er diesen Bereich dieses Feldes kontrollieren kann, sodass Sie ihn als lebendig erkennen können. Ein weiteres Beispiel: Sobald wir die Autotür öffnen, muss sie zu Ihnen herüberschauen und „Hallo“ sagen. Diese Art von Erfahrung wurde tatsächlich in sehr kurzer Zeit vor unserer Veröffentlichung im Jahr 2017 abgeschlossen.

F: Endlich geschafft.

A: Ja, ich bin sehr beeindruckt. Es war die Pressekonferenz im Dezember 2017. Am 6. Dezember konnte unser gesamtes Team anhand von etwa zwanzig oder dreißig Fällen erstmals die Erfahrungen mit Nomis Software und Hardware vollständig verbinden. Dies sind sehr spezifische kleine Funktionen. Nomi kann beispielsweise mit Ihnen sprechen, verschiedene Personen begrüßen, nach links und rechts schauen und schließlich feststellen, dass es lebt.

Was ist dann die dritte Stufe, die am Ende bestanden werden muss? Es handelt sich um die Hardware des gesamten Fahrzeugs. Weil Sie denken, dass sich unter Nomi eine rotierende Welle befindet. Es handelt sich um einen Motor mit zwei Freiheitsgraden und nicht um einen Motor mit drei Freiheitsgraden plus Pleuelstangenantrieb, und im Inneren befindet sich ein Riemen. Nachdem diese Dinge gestapelt sind, muss das Auto einem Crashtest unterzogen werden. Viele Leute wissen nicht, dass Nomis Kopf einer Aufprallbelastung von bis zu 60 g ausgesetzt ist. Was sehr interessant ist: Als wir im April 2017 zum Kollisionsexperiment gingen, schickte mir das Team ein Bild von Nomis Kopf Das Logo der Puppe auf dem Kopf, und wir haben tot gelacht. Dann hat sie nach der Kollision ein wenig nachgegeben, aber in diesem Moment konnten wir endlich feststellen, dass Nomi mit dem Auto abgeliefert werden konnte.

Q:Nomi ist der stärkste intelligente Assistent.

A: Hahahaha, ja, es ist zu schwer.

F: Dem Geburtsprozess nach zu urteilen, werden Sie viel philosophisch über die Technologie hinter einem Produkt nachdenken.

A: Wir haben wahrscheinlich zwei Arbeitsszenarien: das eine und das andere. Das Frühstadium erfordert sogenannte Vorstellungskraft und vorausschauendes Denken. In diesem Teil werden wir uns mit der Technologie befassen, da dies die unterste Entwicklungsstufe ist. Wir benötigen ein tiefes Verständnis dieses Rhythmus, um die Möglichkeiten zu erkennen, aber das ist es, was die meisten Menschen tun Wenn es um Dinge geht, schaut jeder zuerst, wohin die Technologie gehen könnte, und dann, was getan werden kann.

Aber vielleicht ist es eine bessere Möglichkeit, zukunftsorientiertere Modellerfahrungen zu machen, einschließlich etwas philosophischem Denken.

Was wir damals zum Beispiel dachten, war das Endergebnis der Mensch-Fahrzeug-Interaktion.

Zu diesem Zeitpunkt möchte ich sagen, ob es sich um GUI oder DUI, GUI oder Mix UI handelt. Was genau ist das? Dies ist ein Fachjargon, der in der Branche häufig verwendet wird. Aber ich denke, diese Sache liegt immer noch innerhalb eines Paradigmas, oder?

Die ultimative Idee, die wir zu Beginn hatten, war also zu sagen, dass Menschen und Autos nicht mit der Luft sprechen. Das heißt: Wie können wir nicht mit der Luft sprechen, aber was ist da? Es ist das Gefühl, dass Sie und er wie Menschen reden, kommunizieren und interagieren.

F: Ich möchte mich einfach von dem durch eine Reihe von Begriffen umrahmten Paradigma lösen, was bedeutet, aus einer etablierten Denkweise auszubrechen. Dann haben Sie auf eine tatsächlich einfachere und menschlichere Art und Weise zusammengefasst, was Sie tun wollten.

A: Das stimmt.

F: Aber bis zu einem gewissen Grad ist es eher abstrakt, anstatt mit nichts zu reden. Was ist Ihrer Meinung nach die angemessenste Art der Interaktion? kommen raus.

A: Sehr wahr. Wir haben uns zum Beispiel vor vier Jahren das Auto ET 9 vorgestellt.

F: Ich habe mir ET9 vor vier Jahren vorgestellt.

A: Ja. Wir haben darüber nachgedacht, wie es sich damals ändern würde? Welche Art von Iteration und Entwicklung ist für das Erlebnis in der ersten Reihe erforderlich? Vor vier Jahren führte man noch größere Dashboards ein, die umfangreiche SR- und ESD-Informationen präsentierten. Bis heute,TeslaDer S und der X bringen das große Armaturenbrett zurück.

Aber wessen Angst bereitet ihm die Tatsache, dass sich diese Art von Informationen jeden Tag vor den Benutzern häufen? Tatsächlich ist es nicht die Angst des Benutzers.

Also haben wir damals gefragt, ob das Gespräch zwischen Autos und Menschen herzlicher werden könnte, so wie ich es mir beim autonomen Fahren wünsche. Vielleicht ist es ganz einfach ein Satz, ich fahre, du musst dir darüber keine Sorgen machen, es ist nur meine Einbildung.

Wenn Apple wirklich ein Auto bauen würde, wie würde die Interaktion mit den Menschen aussehen? Ich verstehe, dass die Wahrscheinlichkeit hoch ist, dass auf dem Mac ein kleines Symbol mit einem Lenkrad darauf erscheint, und bumm, es wird grün, und dann brauchen Sie sich darüber keine Sorgen zu machen. Es könnte so etwas sein.

F: Das ist sehr Apple.

A: Anstatt Ihnen eine Menge Informationen zu präsentieren und Ihnen zu sagen, was Sie tun sollen.

Ich denke also, wenn man mehr nach vorne denkt, sollte man zum Wesen des Menschen zurückkehren und darüber nachdenken, was richtig ist. Das Einfachste ist, dass mir der erste Wall-E-Film und Zeichentrickfilm schon immer gefallen hat und ich fand, dass es eine Szene darin gab, die sehr interessant war, das heißt, die Leute in der Zukunft waren alle sehr fett. Warum? Denn jedes Mal, wenn die KI vorbeikommt und ihm ein Ergebnis präsentiert und sagt, ob ich es will oder nicht, ob ich es will oder nicht, muss man es nur bestätigen. Dann ist das unser Endspiel.

F: Ob Menschen also dick sind oder nicht, ist eine andere Frage.

A: Ja. Dann werden die Leute auch Sport treiben. (lachen)

F: Es scheint definitiv so, als ob wir dieser Zukunft jetzt näher kommen. Auf Nio IN haben Sie das Nomi GPT-System eingeführt. Wann haben Sie damit begonnen? Wie wurde Nomi mit dem Segen eines großen Modells?

A: Dieses Jahr ist tatsächlich unsere erste Version, und wir haben letztes Jahr damit begonnen, sie auf Lager zu haben. Es hat letztes Jahr lange gedauert, daran zu arbeiten, und dann wurde es dieses Jahr veröffentlicht.

F: Als ChatGPT herauskam, wurde mir sofort klar, welche Bedeutung es für Nomi hat.

A: Ja. Von letztem Jahr bis zu diesem Jahr haben wir dann hauptsächlich an unserem eigenen Basismodell gearbeitet. Die erste Version dieses Jahres, die auf dem Nomi GPT-Framework basiert, ist also unsere 245-Version zu Beginn dieses Jahres. Aber für die Zukunft bereiten wir uns eigentlich noch darauf vor, dass man neben Dingen wie Fragen und Antworten für große Models und diesem ChatBot auch Dinge wie das Generieren von Bildern tun kann? Wir haben das spät gemacht, relativ spät, weil es für dieses Ding keine Autoszenen gibt.

F: Warum machen wir es dann immer noch?

A: Lassen Sie mich nur eines sagen. Unsere Hauptaufgabe beim Erstellen von Bildern im Auto besteht darin, zu hoffen, dass jeder Benutzer Nomi kennenlernen kann, nachdem er ins Auto gestiegen ist. Dadurch erhält jeder einen Avatar und einen Ausdruck, der einem Emoji ähnelt.

Und wenn wir dieses Jahr noch weiter gehen, wird die größte technologische Iteration die Arbeit an der kognitiven Intelligenz und der gesamten Situation sowie exklusiven Emotionen sein.

F: Dann haben Sie selbstständig ein Modell entwickelt.

A: Ja. Dies ist eigentlich eine Kombination aus einer Reihe von Modellen, und viele Leute nennen dies eine Modellgruppe. Wir haben die gleiche Logik.

Tatsächlich gibt es dahinter ein Planungszentrum, das das kognitive Zentrum von NomiGPT ist und dann die entsprechenden Funktionen plant. Unabhängig davon, ob es ausgereift ist, verwendet es direkt die Basismodellfunktionen, um einige Dialoge zu erstellen, oder verwendet einige kleine Modelle einige Aufgaben erledigen. Manchmal verwenden wir unser fein abgestimmtes Modell, das an unserem eigenen Wertesystem ausgerichtet ist, um bestimmte Szenarien, wie zum Beispiel Dienstleistungen, umzusetzen. Genau so sind unsere Agenten entstanden.

F: Haben Sie intern wieder ein sogenanntes großes Modellteam gegründet?

A: Ja, unser Name ist das AI-System-Team. Produkte und Technologien arbeiten eng zusammen. Ich denke, es handelt sich eher um eine Reihe von Modellen, die der Omni-Modalität von OpenAI ähneln, und ich werde später in diesem Jahr mit Ihnen kommunizieren.

1

NIO betreibt im Wesentlichen emotionale Intelligenz, und Her wird sie zuerst im Auto umsetzen.

F: Die Geburt von Nomi und die Entwicklungsrichtung vieler großer Modelle heute legen Wert auf Emotionen. Warum Emotionen und Kameradschaft so wichtig sind. Denn Produkte wie ChatGPT beginnen eigentlich nicht mit Emotionen, um die Technologie voranzutreiben.

A: Ja. Wie bei Inflection gibt es tatsächlich relativ wenige Leute, die tatsächlich in dieser Richtung arbeiten.

F: Und das ist Ihr Ausgangspunkt.

A: Ja, denn hier kommt es zunächst auf den Kern unseres Geschäftsmodells an. Denn ein Auto ist ein großer Gegenstand mit einem langen Lebenszyklus. Dann sagte Bruder Bin auch: Wir machen kein Robotaxi, also ist es nur ein Auto, eine Person, eine Familie und ein Leben lang. Wenn man es abstrakt betrachtet, handelt es sich bei diesem Ding im Wesentlichen um eine Art emotionale Intelligenz.

F: Wie kann man dieses Ding für eine lange Zeit existieren lassen? Nachdem Sie darüber nachgedacht haben, denken Sie, dass die einzige Verbindung, die eine Verbindung herstellen kann, Emotionen sind.

A: ja.

F: Das ist zu soziologisch.

A: Hahaha, das liegt am Einfluss von Bruder Bin.

F: Was sind Nomis nächste Pläne?

A: Wenn wir etwas weiter blicken, sprechen wir heute tatsächlich über kognitive Intelligenz und Situationsintelligenz. Dies sind tatsächlich einige der technischen Rahmenbedingungen, auf die sich die Branche weiterentwickelt. Etwas zu bauen.

Dabei geht es vor allem darum, die Situation wahrzunehmen und zu verstehen und darauf aufbauend zu argumentieren. Darüber hinaus sehen Sie, dass eine unserer sehr wichtigen Aufgaben im letzten Jahr der Aufbau eines Nomi-Speichers war. Für uns ist das Speichermodul eine strategische Sache, in die wir noch zwei bis drei Jahre investieren werden. Es muss sicher sein. exklusiv, zuverlässig und vertrauenswürdig. Es gibt einen Sinn. Das ist eine sehr wichtige Sache. Nur mit diesen Dingen kann man über diese sogenannten emotionalen Erfahrungen sprechen. Dahinter steckt tatsächlich eine Menge Vorarbeit und Ausrichtungsarbeit.

Einschließlich Nomis Generationsfähigkeit ist die Abstimmung von Illusionen und Werten ein sehr großes Problem, denn Sie werden feststellen, dass das, was wir tun, zu ernst ist, es ist sehr ernst. Wenn Sie kein ChatGPT sind, können Sie mit Benutzern einen Witz machen, indem Sie etwas Unangemessenes sagen, und Benutzer werden denken, dass es sich um einen schlechten Fall handelt. Nein, du bist zum Beispiel im Auto, du bist der Nomi dieser Familie, und dann tust du etwas, was eine allgemeine KI tut, das ist vielleicht egal, aber der Benutzer findet es schade, und am Ende vertraust du vollkommen Zusammenbrüche.

Das ist also auch für uns eine sehr große Herausforderung, der wir uns als nächstes stellen müssen, und dahinter steckt eine Menge zu tun.

F: Sie werden Produktiterationen auch in Echtzeit durchführen.

A: Ja. Wir haben eine Verbindung, die für uns ein täglicher Treiber ist und Kraftstoff in den Motor einspeist. Es wird von unseren Benutzern geteilt.

Denn unsere früheste fahrzeuginterne KI kann Feedback in Form von Dialogen geben. Sie rufen „Hallo Nomi“, um ein Problem zu melden, und dann werden das Protokoll und der Status, einschließlich Ihres Problems, in Echtzeit analysiert. Es kann jetzt innerhalb weniger Stunden automatisch an unsere Produktmanager verteilt werden. Dies ist die Fähigkeit, die wir seit 2018 aufgebaut haben. Mit solchen Kanälen können wir sehr gut zählen und überprüfen, was unsere Produkte haben, einschließlich Anforderungen und Probleme, und wir können sie schnell iterieren.

Wir müssen so viele Dinge gleichzeitig tun. Wie können wir die kurzfristige und langfristige Bereitstellung von Benutzernutzen in Einklang bringen?

F: Ihre Vision für Nomi erinnert zunehmend an den Film „Her“. Sie haben bereits erwähnt, dass dieser Film Sie inspiriert hat. Wenn Nomi nicht nur als KI im Auto betrachtet wird, ist es für jeden auch eine sehr wichtige Richtung, die Produktform der KI zu erkunden. Ist das die Szene in „Her“ oder die KI-Begleitung, über die wir jetzt mehr diskutieren, ist es besser, in der Umgebung dieses Autos geboren zu werden?

A: Ja, ich denke, es ist sehr gut möglich. Ich denke, es könnte sogar schneller sein als intelligente Lautsprecher und Telefone.

Hier gibt es zunächst einen interessanten Punkt, nämlich die räumlichen Eigenschaften, Bewegungsattribute und exklusiven Eigenschaften des Autos. Schließlich ist es zu teuer, daher sind der Zeitwert, der emotionale Wert und der emotionale Wert, den die Menschen darin investieren, enorm. Ich denke, es ist eine sehr gute Gelegenheit.

Zweitens verfügt das Auto hinsichtlich seiner Hardware, Rechenleistung und Eigenschaften über die stärksten verkörperten Intelligenzfähigkeiten von allen. Denn mit einem Mobiltelefon kann man doch nicht 360 Grad wahrnehmen, oder? Man kann nicht sagen: „Komm und steig ins Auto, klick, das Telefon ist rausgeflogen.“ (lachen)

Da wir jetzt über verkörperte Intelligenz sprechen, ist das Auto tatsächlich der erste intelligente Agent, der diese Fähigkeit beim intelligenten autonomen Fahren realisiert. Daher denke ich auch, dass er diese Art der Wertschöpfung nutzen kann, um die größte Veränderung herbeizuführen, daher bin ich fest davon überzeugt, dass er die Chance hat, zu solch einer ultimativen Produktform zu werden. .

F: Ein Auto ist eine Maschine. Man kann es als „Tötungsmaschine“ mit einer Geschwindigkeit von 120 Kilometern pro Stunde bezeichnen, aber unter dem Vertrauen, das in der Geschichte der Menschheit in Maschinen aufgebaut wurde, ist das Vertrauen in Autos möglicherweise das stärkste. Tatsächlich besteht eine der Herausforderungen der KI-Technologie darin, dieses Vertrauen aufzubauen.

A: Sehr wahr.

F Und es selbst herrscht ein solches Umfeld des Vertrauens.

A : Rechts. Wenn Sie ein Auto besitzen, haben Sie mit Ihrem Vertrauen eine große Stimme abgegeben, daher sollten Sie (als Automobilhersteller) die Erwartungen der Benutzer nicht enttäuschen.