uutiset

Li Auto Lang Xianpeng: Ilman 1 miljardin dollarin voittoa tulevaisuudessa meillä ei ole varaa itsenäiseen ajamiseen |

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Haastattelu| Li Qin ja Li Anqi

Teksti |. Li Anqi

Toimittaja |. Li Qin

Kesäkuun alussa, päivää ennen puhettaan Chongqing Automobile Forumissa, Li Xiang, Li Auton toimitusjohtaja, muutti tilapäisesti puheen käsikirjoitusta. Ryhmä valmisteli hänelle alun perin aiheen tekoälystä, mutta Li halusi puhua autonomisesta ajamisesta.

Li Xiang sanoi kokouksessa, että autonominen ajo tulee olemaan kuin ihminen, jolla on kyky reagoida nopeasti ja kyky käsitellä monimutkaisia ​​tapahtumia loogisella päättelyllä. Ihanteellinen vastaus on: päästä päähän + VLM:n visuaalinen kielimalli - tämä on myös älykkään ajoteollisuuden tämän hetken kuumin aihe.

Kuukautta myöhemmin Li Auton älykäs ajotiimi julkaisi yksityiskohtaisen "end-to-end + VLM" -ratkaisun. Li Auton ratkaisu on lähempänä Teslaa ja on nimeltään "One". Malli”, iso verkko.

Ulkomaailman vaikutelmassa ihanteellinen älyauto on aina ollut jahtaaja. Viime vuonna alan kovan Kaicheng-sodan aikana saavuttaakseen alan vauhtia Ideal alkoi usein muuttaa reittiään: luottaen erittäin tarkkoihin karttoihin kevyisiin karttoihin (NPN-ominaisuusverkot) ja sitten eliminoimalla sen. korkean tarkkuuden karttoja.

Li Auton älykkään ajon tutkimus- ja kehitysjohtaja Lang Xianpeng ja älykkään ajoteknologian tutkimus- ja kehitysjohtaja Jia Peng hyväksyivät äskettäin haastattelun 36Kr:n kanssa Periaatteena on, voimmeko löytää ongelman olemuksen ja päättää sen jälkeen nopeasti.

"Päästä-päähän" teknisen reitin valitseminen on myös jatkoa tälle periaatteelle. Lang Xianpeng sanoi, että aiemmin älykkäät ajoratkaisut, olivatpa ne karttakevyitä tai karttattomia, taustalla oleva tekninen arkkitehtuuri oli "karttapohjainen" ja toimi olemassa olevan "havainto-ohjausprosessin" mukaisesti tiedot vaurioituivat, ja loppupään sääntelyä ja valvontaa rajoitettiin "Tämä vaatii paljon työvoimaa ja resursseja" haavoittuvuuksien jatkuvaan korjaamiseen.

Tietenkin resurssien sijoittaminen on edelleen toissijainen ongelma. Ydinongelma on, että "sääntöihin perustuvalla älykkäällä ajokokemuksella on yläraja, eikä se voi koskaan olla antropomorfista".

"Päästä päähän + VLM + maailmanmalli" on ihanteellinen tekoälyn toteutusparadigma.

Yksinkertaisesti sanottuna ihanteellinen päästä päähän -ratkaisu eliminoi alkuperäisen älykkään ajojärjestelmän useat itsenäiset moduulit, kuten havainnoinnin, ennustamisen ja suunnittelun ohjauksen, jotka perustuvat keinotekoisiin sääntöihin, ja yhdistää ne suureksi hermoverkoksi. "Syöte anturin tiedot ja ulostulon suunniteltu lentorata."

VLM:n visuaalinen kielimalli tarjoaa ChatGPT:n kaltaisen päästä päähän -laajennuksen. Lopullinen kysymys on "millaista dataa annat sille, millainen käyttäytyminen sillä tulee olemaan VLM:n visuaalisen kielen mallilla on kyky ymmärtää maailmaa ja loogista päättelyä." Monimutkaisissa skenaarioissa päästä päähän -käyttäjät voivat esittää VLM-kysymyksiä reaaliajassa, ja jälkimmäinen antaa asiaankuuluvia ajoehdotuksia.

Maailmanmalli on valtava väärä testikirja, joka voi tuottaa simulaatiodataa rekonstruoinnin + tuotannon kautta sekä ennen Idealia kertyneet todelliset tapaukset muodostaen "oikeat testikysymykset + simuloidut testikysymykset" päästä päähän -mallin testaamiseksi. Vasta sen jälkeen, kun malli on läpäissyt testin ja saavuttanut korkeat pisteet, sitä voidaan mainostaa käyttäjille.

Sisäisesti näitä kolmea mallia kutsutaan järjestelmäksi 1, järjestelmä 2 ja järjestelmä 3. Järjestelmä 1 vastaa ihmisen aivojen reaaliaikaista ajattelutapaa, System 2 vastaa ihmisen aivojen loogista ajattelua ja System 3 on koemalli, joka vastaa järjestelmän 1 ja järjestelmän 2 koulutus- ja oppimistulosten hyväksymisestä.

Älykkään ajoteknologian käynnisti Tesla. Elokuussa 2023 Musk esitteli päästä päähän FSD v12 -version ominaisuudet suorassa lähetyksessä. Tällä hetkellä FSD on iteroitu v12.5-versioon. Mutta toisin kuin Tesla, Ideal esittelee kokonaisvaltaisen ja maailmanmallin lisäksi myös VLM:n suuria kielimalleja.

Jia Peng selitti 36Kr:lle, että hän vietti viikon Yhdysvaltojen itärannikolla ja länsirannikolla testaamassa Teslan FSD:tä ja havaitsi, että jopa "päästä päähän" on yläraja. Yhdysvaltojen itärannikolla, jossa tieolosuhteet ovat monimutkaiset, kuten New Yorkissa ja Bostonissa, Teslan hyväksyntäaste on kasvanut merkittävästi olla erityisen suuri, ja mallikapasiteetilla on myös luonnollinen yläraja."

VLM:n ihanteellisena tehtävänä on nostaa "päästä päähän" ylärajaa. Se voi oppia kuoppateistä, kouluista, olla vastuussa rakentamisesta, liikenneympyröistä ja muista tapahtumista sekä tarjota päätöksentekoa päähän. -järjestelmän lopettaminen kriittisillä hetkillä.

Sekä Lang Xianpeng että Jia Peng uskovat, että VLM on isompi muuttuja ihanteellisessa älykkäässä ajojärjestelmässä. Koska VLM:n parametrit ovat saavuttaneet 2,2 miljardia ja vasteaika on 300 millisekuntia, jos sirussa on suurempi laskentateho, VLM:n käyttöönotettavien parametrien määrä nousee kymmeniin miljardeihin, mikä on paras tie edistyneeseen autonominen ajo L3/L4.

"VLM itse seuraa myös suuren kielimalliteknologian kehitystä. Kukaan ei voi vastata, kuinka suuri parametrien määrä lopulta tulee olemaan."

Ei ole vaikeaa havaita, että ominaisuudet, kuten dataohjatut ja suuret visuaaliset kielimallit, määräävät älykkään ajoteollisuuden osallistumisen OpenAI:n, Microsoftin ja Teslan kaltaisten yritysten käynnistämään laskentatehopeliin.

Lang Xianpeng ei vähätellyt sanoja, kun se tulee tähän kohtaan, kaikki vertaavat tietojen määrää ja laatua sekä laskentatehoreserviä. Laadukas data perustuu absoluuttiseen mittakaavaan, joka tukee L4-mallin koulutusta, vaatii noin kymmeniä EFLOPS:ia laskentatehoa.

"Millään yrityksellä ilman miljardin dollarin nettovoittoa ei ole varaa itsenäiseen ajamiseen tulevaisuudessa."

Tällä hetkellä Li Auton pilvilaskentateho on 4,5 EFLOPS, mikä on nopeasti kaventanut eroa johtavaan Huaweihin. 36Kr Auton mukaan Ideal on äskettäin ostanut suuren määrän NVIDIA-pilvisiruja ja "osti periaatteessa kaikki kortit kanavakauppiaiden käsissä".

Toimitusjohtaja Li Xiangilla on myös näkemys tämän kilpailun trendistä: resurssien ja älykkään teknologian vipuvaikutuksen avulla päästä eroon vertaisista. Hän tekee usein aloitteen ja kysyy Lang Xianpengiltä: "Onko laskentaresursseja tarpeeksi? Ei riitä, että Xie Yan (ihanteellinen teknologiajohtaja) saa lisää."

"Meillä on myös autoja ja enemmän rahaa kuin muilla. Meillä on loistava mahdollisuus kasvattaa kuilua vastustajiimme tällä tiellä." Li halusi sanoa. Talousraportti osoittaa, että tämän vuoden ensimmäisellä neljänneksellä Li Auton kassavarat olivat lähes 99 miljardia juania.

Ideal näkee sisäisistä tiedoista, että älykkään ajamisen liiketoiminnallinen suljettu silmukka on alkanut näyttää merkkejä. Heinäkuun alussa Ideal aloitti 6.0 Smart Driving -version toimittamisen Smart Drivingin Max-version käyttäjille. Lang Xianpeng havaitsi, että Lideal Max -mallin osuus ylitti nopeasti 50 % yli 10 % joka kuukausi, jos 2–3 % voidaan ymmärtää normaalina värinänä, mutta yli 10 % on tehokasta kasvua.

Lang Xianpeng tietää myös, että vaikka visio L4-autonomisesta ajamisesta alkaa selkiytyä, sen toteutuspolku ei ole muuttunut "Meidän on nopeasti autettava yritystä myymään autoja. Vain myymällä autoja meillä on rahaa ostaa kortteja älykkään kouluttamiseen ajo."

Jos älykäs ajaminen on voittaja tulevaisuuden autoteollisuuden taistelukentällä, se on selvästi julmempi resurssipeli. Ideal on tehnyt ennakkovalmisteluja huipputason strategiasta tekniseen valmisteluun ja resurssien investointeihin.

Seuraava on keskustelu 36Kr Automobilen ja Ideal Intelligent Driving Technologyn tutkimus- ja kehitysjohtajan Lang Xianpengin ja Ideal Intelligent Driving Technologyn tutkimus- ja kehitysjohtajan Jia Pengin välillä.

Älykkään ajamisen ylärajasta puhuttaessa: olipa kuvaa tai ei, se on homogeeninen arkkitehtuuri

36Kr Auto: Onko sisäinen tarkistus tehty? Miten älykkäässä ajamisessa jälkeen jääneestä päästään nopeasti Huaweihin verrattavalle tasolle?

Lang Xianpeng: Verrattuna Xiaopengiin, NIO:han ja Huaweihin emme tarkoita, että meillä olisi useita päitä, emmekä ehkä edes ole yhtä monta perhettä kuin muilla, mutta vaadimme realistisuutta. Joskus minusta tuntuu, että ihmiset eivät ehkä etsi ongelman ydintä.

Esimerkiksi kuvien saamisesta kuvien puuttumiseen suurin ongelma on itse kuva. Olen tehnyt paljon työtä kartan parissa ja haluaisin vielä vähän kamppailla. Itse asiassa haluan panostaa nopeasti seuraavaan tutkimus- ja kehitysvaiheeseen. Se riippuu siitä, löydämmekö olennaisen ongelman ja päätämme korjata sen nopeasti.

36Kr Automobile: Ihanteellinen on saavuttaa valtakunnallinen karttavapaa älykäs ajo. Miten poikkeama korjataan?

Lang Xianpeng: Viime vuonna Shanghain autonäyttelyssä kaikki alkoivat tehdä kaupunkilaista NOA:ta. Jokaisella yrityksellä on samanlaisia ​​ajatuksia moottoriteillä, joten ensimmäinen askel on nähdä, voidaanko tiesuunnitelmaa käyttää kaupungeissa kaupungeissa, mutta vain noin 20 kaupungissa. Sanoimme, että kokeile ensin.

Suunnitelman ja kartan iteratiivinen päivitys on kuitenkin sidottu. Tuolloin työskentelimme Wangjingissa. Rakensimme teitä, vaihdoimme reittejä ja jopa liikennevaloja. Jouduimme odottamaan, että AutoNavi toistaa piirustukset ennen kuin pystyimme jatkamaan työtä. Viime vuoden kesäkuun tienoilla päätimme olla tekemättä karttaa uudelleen ja siirtyä käyttämään NPN-ratkaisua (a neuroprior network). Se vastaa paikallista kartoitusta, jossa käytetään NPN:n ennakkotietoja suurissa risteyksissä, liikenneympyröissä jne., ja automme päivittää ominaisuuksia.

Mutta suurissa kaupungeissa, kuten Pekingissä, Shanghaissa, Guangzhoussa ja Shenzhenissä, on paljon autoja. Mutta pienissä kaupungeissa on vähän autoja. Teetkö sitä aina isossa kaupungissa? Käyttäjät eivät maksa siitä. Tuolloin joukkue epäröi ja Pekingillä, Shanghailla ja Guangzhoulla meni hyvin. Myös sisäisiä ääniä sanotaan, että sadan kaupungin sijaan meidän pitäisi rakentaa muutama ensiluokkainen kaupunki Joka tapauksessa, Huawei on aluksi vain 50 kaupungissa, joten meidän ei tarvitse olla ensimmäinen tai toinen.

Sanoin, että se ei ole mahdollista, ja minun on silti tehtävä se nopeasti. Haluan silti tietää, onko NPN-menetelmä hyvä, jos se todella tehdään suuremmassa mittakaavassa? Tämä on ongelma Mapsissa aina, ja on myös kritiikkiä, että jotkut kaupungit voivat avata vain kaksi tietä. Joten opittuamme kokemuksista aloimme leikkaamaan suunnitelmia toimitettuamme 100 kaupunkia viime vuoden joulukuussa.

36Kr Auto: Mitä tarvitaan graafittoman NOA:n kehittämiseen päästä päähän?

Lang Xianpeng: Ongelma on edelleen ilman kuvaa. Osoittautuu, että kartta voi tarjota suhteellisen tarkkaa tietoa Kartan aiemman tiedon poistamisen jälkeen vaatimukset ylävirran havainnolle nousevat erityisen korkeaksi. Alavirran säätelyn ja ohjauksen saralla tiedonsyöttö oli ennen hyvin säännöllistä, mutta nyt havaitaan, että värinää ja virheitä on, ja se on myös iso haaste.

Sen jatkaminen vaatii paljon työvoimaa. Jos esimerkiksi havaitsemisessa on ongelmia, väliympäristömalliin on lisättävä paljon sääntöjä. Tämä asettaa tiimille valtavan henkilöstöhaasteen. Näin Huaweista tuli ilman kuvia (työvoimaetu) Halusimme alun perin palkata lisää ihmisiä viime vuoden toisella puoliskolla.

Mutta tämän asian yläraja on ilmeinen. Pääasiassa kaikki säännöt ovat ihmisten laatimia ja insinöörien suunnittelemia. Varsinkin tämän vuoden tammi- ja helmikuussa muutimme usein sääntöä. Jos tämä tapaus toimii hyvin, muut tapaukset eivät toimi. Keskinäinen osallistuminen on liian suurta ja loputonta.

Resurssien sijoittaminen on tietysti toissijaista. Tärkeintä on, että sääntöpohjaisella kokemuksella on yläraja, eikä se voi koskaan olla antropomorfista. Joten me iteroimme nykyiseen päästä päähän ja VLM:ään. Päästä loppuun, tämä on ensimmäinen kerta, kun tekoälyä käytetään älykkääseen ajamiseen.

36Kr Auto: Milloin on paras aika aloittaa kokonaisvaltaiseen sijoittamiseen?

Lang Xianpeng:Meillä on aina kaksi työlinjaa, yksi on avoin linja massatuotannolle ja -toimitukselle, viime vuonna NPN-valokuva ei kuvaa on avoin linja ja päästä päähän on tumma viiva, joka on esi- tutkimuslinja.

Yanqi-järven strategiakonferenssi teki sen selväksi viime vuonna. Strategiakokouksessa Li Xiang mainitsi, että autonominen ajaminen on ydinstrategiamme ja RD:n (teknologian tutkimus ja kehitys) on saavutettava tärkeitä virstanpylväitä. Päästä päähän -idea on ollut olemassa jo pitkään, mutta toimituspaineita on aina ollut, eikä resursseja ole tutkittava.

36Kr Auto: Wutu saattaa joutua menemään päästä päähän pian sen julkaisun jälkeen. Miten tämä rytmi otetaan huomioon?

Lang Xianpeng: Vuoden alussa kerroin Li Xiangille tämän: Vaikka haluamme tehdä päästä päähän, meidän on silti tehtävä se ilman kuvaa. Koska kaavioton on päästä päähän -tuki Ilman kaavioita, mistä tiedot ja kokemus tulisivat päästä päähän?

Ja se on ladattava ilman kuvia ennen kuin auto voidaan myydä helposti. Muuten kuinka se voi kilpailla Huawein kanssa? Nyt kun olemme Wutulla, yritämme ostaa aikaa päästä päähän ja samalla parantaa tuotevalmiuksiamme auttaaksemme autojen myyntiä.

36Kr Auto: Olet matkan varrella kieltänyt suunnitelmasi. Onko sinulla painetta ylöspäin johdon näkökulmasta?

Lang Xianpeng:Ei. Ensinnäkin, minun vastuullani on saada kaikki ymmärtämään autonomista ajamista. Toiseksi ihanteellisella organisaatiolla on oma menetelmänsä tai prosessinsa, kuten oikeiden mutta ei helppojen asioiden tekeminen.

Li Xiang ei koskaan sanoisi, miksi Lang Bo kielsi sen, mitä hän oli tehnyt aiemmin. Teimme hänelle selväksi, miksi teimme tämän, että halusimme voittaa tekoälystrategiassa ja löysimme kaksoisjärjestelmän paradigman, jonka hän heti ymmärsi. Hän sanoisi vain, että päästä päähän on hienoa ja se on tehtävä nopeasti.

Tekoäly vaatii laskentatehoa ja dataa. Li Xiang tulee usein luokseni ja kysyy minulta, Lang Bo, oletko tarpeeksi voimakas? Jos se ei riitä, pyydä Xie Yania hankkimaan sinulle lisää.

Li halusi sanoa, että meillä on myös autoja ja enemmän rahaa kuin muilla, joten meillä on loistava mahdollisuus laajentaa kuilua muihin tällä tiellä. Älä siis tee tätä puuhailua, vaan toimi nopeasti ja tee tekoäly sen takana.

Puhutaan älykkään ajamisen tulevaisuudesta: päästä päähän + VLM on tekoälyn paras paradigma

36Kr: Jotkut yritykset eivät ole koskaan tehneet karttaa ja ajattelevat, että päästä päähän on mahdollisuus vaihtaa kaistaa ja ohittaa.

Lang Xianpeng: Se on puoliksi oikein. On todellakin mahdollista vaihtaa kaistaa päästä päähän riippumatta siitä, onko graafia, NPN tai ei, ratkaisun ydin on homogeeninen. Poista kartta, paranna havaintoa, pinoa pienet moduulit useiksi suuriksi malleiksi ja käytä samaa suunnitelmaa kehittyäksesi pikkuhiljaa.

Mutta päästä päähän on eri asia. Ensimmäistä kertaa se käyttää tekoälyä autonomiseen ajamiseen. Kun One Model -mallia on käytetty päästä päähän, syöttö on vain dataa, lähtö on lentorata ja välimoduulit integroidaan yhdeksi malliksi.

Koko T&K-prosessijärjestelmä on täysin erilainen. Perinteisessä tuotekehitysmallissa liikkeellepaneva voima tulee kysynnän suunnittelusta tai ongelmapalautteesta. Se ei toimi tässä skenaariossa Virheen esiintymisen jälkeen tarvitaan manuaalinen suunnittelu iterointi ja tarkistus.

Päästä päähän on musta laatikko, ja sen ominaisuudet riippuvat täysin siitä, millaista dataa sille annetaan. Suodatamme nyt kokeneiden kuljettajien tiedot. Jos tiedot eivät ole hyviä, tuote ei ole hyvä. Se mikä menee sisään, on roskaa ja mikä tulee ulos, on roskaa. Se on tiedonkulun koulutusprosessi. Ennen se oli tuotetoimintojen tutkimus- ja kehitysprosessi, mutta nyt se on kyvykkyyden parantamisprosessi.

Joten ei ole ongelmia kaistanvaihdossa päästä päähän, mutta jos haluat ohittaa, sinulla on oltava data- ja koulutuslaskentateho. Jos näitä kahta edellytystä ei ole, rehellisesti sanottuna kaikilla on malli, eikä itse malli ole kovin erilainen. Ei ole väliä kuinka hyvä malli on, ilman dataa ja laskentatehoa se on vain joukko parametreja.

36Kr: Ihanteellinen on kerätä paljon dataa, mutta He Xiaopeng esitti äskettäin ajatuksen, että enemmän dataa ei tarkoita, että autonominen ajaminen voidaan saavuttaa.

Lang Xianpeng:Harjoitustietomme ovat leikkeitä, jotka sisältävät täydelliset tiedot kuljettajan ajamisesta kymmenien sekuntien ajan, mukaan lukien visuaaliset anturit, ajoneuvon tilatiedot sillä hetkellä sekä käyttötiedot, kuten kaasupoljin ja jarru.

Tietojen on kuitenkin oltava korkealaatuisia, jotta niistä olisi hyötyä. Mikä on korkea laatu? Yhdessä tuotteiden ja ajoneuvojen subjektiivisen suorituskyvyn arviointitiimimme kanssa olemme yhdessä määrittäneet standardin nimeltä "Human High-Quality Driver". Jotkut kuljettajat ajavat joka päivä ja ovat erittäin taitavia. Jos he aina kiihdyttävät ja hidastavat äkillisesti, käyttävät AEB:tä tai kääntävät ohjauspyörää äkillisesti, se ei välttämättä toimi.

Näiden standardien mukaan vain 3 % 800 000 autonomistajastamme on "inhimillisiä korkealaatuisia kuljettajia". Yhdessä aiemmin kertyneen korkealaatuisen tiedon kanssa syntyy lopulta miljoonia leikkeitä, jotka ovat kaikki parhaita. Hän Xiaopeng on oikeassa, laadukasta tietoa todellakin tarvitaan, mutta tietojen laatu perustuu tietojen absoluuttiseen mittakaavaan.

36Kr Auto: Pitäisikö tietotyökalujärjestelmä päivittää päästä päähän?

Lang Xianpeng: Työkaluketju on muuttunut paljon. Aikaisemmin se oli tuotetoimintojen kehitysprosessi, kuten käyttäjän haltuunotto, tiedonsiirto, manuaalinen ongelmien analysointi ja sitten koodin muokkaus, varsinainen ajoneuvon arviointi ja verkkojulkaisu. Tämä suljetun silmukan dataprosessi on jo erittäin tehokas. Mutta se kestää myös useita päiviä, ja siihen tarvitaan paljon työvoimaa, mitä enemmän testejä on, sitä enemmän tulee olemaan ongelmia ja sitä enemmän ihmisten on tehtävä muutoksia.

Nykyinen prosessi on se, että jos auton omistaja ottaa haltuunsa, datan palautumisen jälkeen samankaltaiset kohtaukset luodaan automaattisesti maailmanmallilla ja muuttuvat vääräksi kysymyspankiksi. Tarkista myös, onko samankaltaisia ​​tietoja väärässä kysymystietokannassa. Jos ei, tutustu olemassa olevaan tietokantaan ja järjestä yhteinen koulutus.

Uuden mallin koulutuksen jälkeen malli palaa maailman mallikoejärjestelmään ja testataan kahdesti. Ensimmäinen kerta on nähdä, oletko tehnyt väärät kysymykset oikein, ja toinen kerta on joukko oikeita kysymyksiä testataksesi kykysi. Jos ongelmaa ei ole molemmilla kerroilla, malli on loppu. Äärimmäisessä päässä ei ole ketään keskellä, ja se on hyvin automatisoitu suljetun silmukan prosessi.

36Kr Auto: Päästä-päähän harjoitusprosessi on musta laatikko, ja paljon koodia on lisättävä yksityiskohtien selvittämiseksi. Voitko arvioida, kuinka paljon työtä siihen liittyy?

Lang Xianpeng:Hyvin harvat grafiikkaversion koodimäärät ovat noin 2 miljoonaa riviä, ja ilman grafiikkaa se on 1,2 miljoonaa riviä, mikä on vain 10 % alkuperäisestä.

Tämän hallitsemiseksi on todellakin joitain piilotettuja sääntöjä. Koska anturitiedot syötetään päästä päähän ja suunniteltu lentorata todella tulostetaan, ongelmia saattaa ilmetä, joten meillä on joitain väkivaltaisia ​​sääntöjä, jotta vältetään epänormaalit ohjauskäyttäytymiset, kuten ohjauspyörän kääntäminen 180 astetta.

36Kr Auto: Musk sanoi, että 300 000 riviä koodia on poistettu. Näytät olevan aggressiivisempi.

Lang Xianpeng: En usko, että se paljon muuttuu. Pääasia on, että meillä on kyky toistaa itseämme jatkuvasti.

36Kr Auto: Idealilla on aina ollut sisäisesti kaksi linjaa: massatuotanto ja esitutkimus. Esitutkimuksesta massatuotantoon siirtyminen on nyt sitä, mikä on esitutkimusta?

Lang Xianpeng: L4. Tämä juontaa juurensa käsityksemme tekoälystä. Huomasimme, että jos haluamme saavuttaa todellisen autonomisen ajamisen, nykyinen lähestymistapa on hyvin erilainen.

Päästä päähän, millaista dataa sille annetaan, millainen käyttäytyminen sillä on. Jos vastaavia tietoja ei anneta, niitä ei käsitellä. Mutta ihmiset eivät ole. Jos esimerkiksi aion ajaa Pekingissä, voin ajaa myös Yhdysvalloissa. Jos todella haluamme saavuttaa autonomisen ajamisen, järjestelmän on ymmärrettävä asioita, kuten ihmiset, ja sillä on oltava kyky järkeillä.

Tutkimme kuinka ihmisen aivot toimivat ja ajattelevat Viime vuoden elokuussa ja syyskuussa Jia Peng ja Zhan Kun näkivät kaksijärjestelmäteorian, joka on erittäin hyvä kehys ihmisen ajattelulle. Oletetaan, että tekoäly on kaksoisjärjestelmä, järjestelmällä 1 on kyky reagoida nopeasti ja järjestelmällä 2 on kyky ajatella loogisesti ja se pystyy käsittelemään tuntemattomia asioita.

Nämä ovat kaikki osa Taoa, asioita teoreettisella tasolla. Mitä tulee autonomiseen ajamiseen, päästä päähän -malli on System 1, ja System 2 on VLM:n visuaalinen kielimalli. Tämä on paras ratkaisu tekoälyn toteuttamiseen fyysisessä maailmassa.

Joten miten mittaat System 1:n ja System 2:n ominaisuudet? Meillä on myös maailmanmalli, jota kutsutaan itse asiassa System 3:ksi. Käytämme maailmanmallia System 1:n ja System 2:n testaamiseen.

Meillä on todellinen testipankki, joka on todellista tietoa normaalisti ajavista ihmisistä. Maailmanmalli on generatiivinen malli, joka voi luoda muita kysymyksiä tekemällä johtopäätöksiä olemassa olevasta tiedosta. Kun malli on koulutettu, suorita oikeat kysymykset kerran ja tee sitten muutama sarja simuloituja kysymyksiä nähdäksesi, kuinka paljon saat. Jokaisella mallilla on pistemäärä, ja mitä korkeampi pistemäärä, sitä tehokkaampi malli.

36Kr Auto: Missä olosuhteissa System 2 laukeaa?

Lang Xianpeng: System 1 ja System 2 toimivat aina. Jos jotkin järjestelmät ovat monimutkaisempia, järjestelmä 1 ei ehkä ole helppo tunnistaa, kuten ylikulkusillat, lätäköt ja äskettäin rakennetut sementtilattiat, mutta sen toimintataajuus on pienempi, kuten 3-4 Hz , Järjestelmä 1 saattaa toimia yli kymmenen hertsin taajuudella. Kuten GPT, System 1 kysyy aina System 2:lta kysymyksiä siitä, mitä tehdä tämän skenaarion kohdalla.

36Kr Auto: Onko System 2 VLM:llä itsessään kykyrajoja?

Lang Xianpeng: Voit ajatella sitä suurena kielimallina. Jotkut suuret kielimallit voivat olla hyviä matematiikassa, jotkut voivat olla hyviä koodaamassa ja niillä on erilaisia ​​ominaisuuksia. Keskitymme tarjoamaan sille ajamiseen liittyviä lakeja, opetusvideoita ja oppikirjoja oppiaineille 1-4. VLM on itse asiassa suuri kielimalli, joka keskittyy ajamiseen.

Lyhyellä aikavälillä sillä ei vielä ole tietoa, mutta suljetun silmukan kääntyessä yhä nopeammin, sen kykyjen yläraja nousee yhä korkeammalle. Nykyiset päästä päähän -parametrit ovat vain yli 300 miljoonaa ja VLM-järjestelmän parametrit 2,2 miljardia.

36Kr Auto: Joten isompi muuttuja älykkään ajamisen tulevaisuudessa on System 2?

Lang Xianpeng:Taustalla oleva tuki on System 1, mutta kun mennään pidemmälle, mukaan lukien L3L4-tason autonominen ajaminen, meillä on oltava erittäin vahvat System 2 -ominaisuudet. Nykyiset 2,2 miljardia parametria ei ehkä riitä, ja lisää on lisättävä.

Jia Peng: System 2 keskittyy pääasiassa monimutkaisiin kohtauksiin. 2,2 miljardin parametrin vasteaika on 300 mm Vaikeissa kohtauksissa tämä päättelyaika on OK. Mutta järjestelmä 1 ei todellakaan riitä, se kestää noin kymmeniä millisekunteja.

36Kr Auto: Onko mallin parametreille yläraja? Kuten 8 miljardia? Mitkä ovat likimääräiset vaatimukset sirujen laskentateholle?

Jia Peng:Kuten suuressa kielimallissa, kukaan ei voi vastata, kuinka monta parametria sillä on.

Lang Xianpeng:Meillä on nyt sekä tietoa että taitoja System 1 plus System 2 on hyvä tekoälyn paradigma, mutta sen toteuttaminen vaatii sen pikkuhiljaa tutkimista.

36Kr Auto: Jos segmentoitu päästä päähän -malli kehittyy yhdeksi malliksi, täytyykö meidän keksiä pyörä uudelleen?

Jia Peng: Haaste on melko suuri Graafiton mallimme vastaa segmentoitua mallia, jossa on vain kaksi mallia. Mutta ensinnäkin, tekninen haaste on suhteellisen suuri, koska kaikki perinteiset ovat poissa. Kuinka kouluttaa mallia saavuttamaan hyviä tuloksia? Toinen on inhimillinen haaste. Kuinka kaksi ihmisryhmää, joilla on erilaiset taustat havaitsemisessa ja hallinnassa, voivat työskennellä yhdessä mallin rakentamiseksi?

Myös tiimimme kamppailee ja heittelee. Kun on kyse päästä päähän, monien ihmisten roolit ovat saattaneet muuttua. Ennen suunnittelua tehneet ihmiset voivat määritellä dataa ja skenaarioita. Roolin vaihtaminen on melkoinen haaste.

Suljetun kierron liiketoiminnasta puhuminen: Sinulla ei ole varaa itsenäiseen ajamiseen ilman miljardia dollaria

36Kr Auto: Kuulostaa siltä, ​​että rahastot palavat. Kuinka paljon aiot sijoittaa kokonaisuuteen?

Lang Xianpeng: Tällä hetkellä se on varmasti 1 miljardi RMB. Tulevaisuudessa autonomisten ajomallien koulutus voi vaatia 1 miljardia dollaria, ei sisällä muita asioita, kuten ostokorttia, sähkölaskuja ja lahjakkuutta. Millään yrityksellä ilman miljardin dollarin nettovoittoa ei ole siihen varaa.

36Kr Auto: End-to-end voi olla vedenjakaja autoteollisuudessa kaupallisesta suljetun kierron näkökulmasta, mikä on älykkään ajamisen kaupallinen suorituskyky?

Lang Xianpeng: Versiosta 6.0 alkaen viimeisten 1-2 kuukauden aikana AD Max -osuutemme on ylittänyt 50 %, ja kasvu on yli 10 % joka kuukausi % on tehokasta kasvua. Pekingissä, Shanghaissa, Guangzhoussa ja Shenzhenissä älykkäiden ajomalliemme osuus on noussut 70 prosenttiin. AD MAX -tilaus L9-mallille on 75 %, L8:lle 55 % ja L7:lle 65 %.

Jia Peng: L6:lla on myös 22 prosenttia. Älykäs ajaminen on jo nyt erittäin tärkeä tekijä nuorten autojen ostamisessa. Älykkään ajon jälkeen on vaikea palata alkuperäiseen tilaan.

Lang Xianpeng: Nykyään nopea NOA on kaikkien tiedossa, kun taas kaupunkien NOA on vielä hyvin varhaisessa vaiheessa. Kaupunkituotteiden ominaisuudet eivät ole suurelta osin riittävän hyviä Ilman kuviakaan ne eivät ole saavuttaneet ihmisen ajomukavuustasoa. Päästä päähän kaikki muuttuu, ja jotkut esitykset ovat melko lähellä ihmistä.

Tietojen ja laskentatehon lisäämisen myötä kokonaisvaltaisesta arkkitehtuurista johdettu älykäs kaupunkiajo tuottaa todennäköisesti nopean ajokokemuksen. Tässä vaiheessa käyttäjille on erittäin hyödyllistä ostaa autoja.

36Kr Auto: Älykkään ajon kaupallinen arvo on tulossa yhä selvemmäksi, mutta ihanteellinen älykäs ajotoiminto on aina ollut ilmainen.

Lang Xianpeng: Monet ostavat Idealin jääkaapeille, väritelevisioille ja suurille sohville, mutta tulevaisuudessa he voivat ostaa myös Idealin älykkääseen ajamiseen, mikä riittää osoittamaan älykkään ajamisen kaupallisen arvon. Ero Max- ja Pro-versioiden välillä on todella 30 000 yuania.

Mitä tulee ohjelmistojen lataamiseen, jos se saavuttaa L4-tason, se on todella mahtavaa. Kuvittele, että voit auttaa käyttäjiä noutamaan lapsensa koulun portilta. Oletko valmis maksamaan tästä palvelusta? Kun ominaisuudet paranevat, uusia liiketoimintamalleja ilmaantuu, mutta lähtökohtana on oltava, että älykkäät ajoominaisuudet paranevat huomattavasti.

36Kr Auto: Xiaopeng mainitsi, että se saavuttaa samanlaisen kokemuksen kuin Googlen Waymo seuraavan 18 kuukauden aikana. Onko sinulla tällainen aikataulu?

Lang Xianpeng: Ei haittaa, jos data ja liiketoiminta tukevat tavoitteita. Olemme tehneet joitain sisäisiä laskelmia. Puhumattakaan L3L4:stä.

Xpeng's on 2,51 EFLOPS ja ihanteellinen 4,5 EFLOPS Se vaatii vähintään 10 EFLOPS laskentatehoa saavuttaakseen sen, mikä on noin miljardi Yhdysvaltain dollaria ja 6 miljardia yuania. Jos sinulla on siihen joka vuosi varaa, voit pelata.

36Kr Auto: Kuinka paljon laskentatehon lisäksi älykäs ajotiimi tarvitsee keskimäärin nykyisen teknisen arkkitehtuurin perusteella investointeja vuodessa?

Lang Xianpeng: Suurin osa kustannuksista on koulutussirut, tiedontallennus ja liikenne, jotka maksavat vähintään 1-2 miljardia dollaria vuodessa. Mutta pidemmälle, erityisesti maailmanmallissa, perimmäisenä tavoitteena on palauttaa koko todellinen fyysinen maailma. Tämä itsessään vaatii myös koulutusta ja vaatii paljon laskentaresursseja.

Mitä tulee ylärajaan, en voi kuvitella, että se on vähintään 10 EFLOPSia.

36Kr Auto: Autoyhtiöt perustuvat edelleen valmistavan teollisuuden voittomalliin. Tänä vuonna käydään hintasotaa, ja se vaikuttaa kannattavuuteen.

Lang Xianpeng: Se, joka saa laadukasta dataa ja jolla on tarpeeksi koulutusta laskentatehoa, voi rakentaa suuren mallin. Lahjoja ei ehkä ole niin paljon, mutta kenellä muulla voi olla kaikki kolme kuin Ideal, Huawei ja Tesla? En saa selvää.

Tämänhetkinen ideamme on auttaa yritystä nopeasti autojen myynnissä. Vain autoja myymällä meillä on rahaa ostaa kortti älykkään ajon kouluttamiseen.

Mitä pidemmälle edistymme älykkäässä ajamisessa, sitä suurempi ero kasvaa. Ennen ei ollut kuvia, mutta kaikki tekivät jotain, josta näkyi katto. Tulevaisuuden läpimurtojen saavuttamiseksi on lisättävä tekoäly, ja kaikki kilpailevat datasta ja laskentatehosta. Jos sitä ei voida ratkaista, voimme vain siirtyä edelliseen ulottuvuuteen, ja siirrymme seuraavaan ulottuvuuteen saadaksemme tiedon jaon.

36Kr Auto: Älykäs ajotekniikka muuttuu niin nopeasti ja investoinnit ovat niin suuria. Kuinka Li Xiang voi ylläpitää tietoisuuttaan älykkäästä ajamisesta?

Lang Xianpeng: Hän puhui opettaja Jialle ja minulle milloin tahansa. Viime vuoden syyskuusta lähtien meillä on ollut viikoittainen tekoälytapaaminen, joka kokoaa yhteen kaikki yrityksen tekoälyyn liittyvät ihmiset, mukaan lukien älykkäiden tilojen, infrastruktuurin ja koulutusalustojen ihmiset. Li Xiangin käsitys tekoälystä on edelleen erittäin hyvä.

Hänellä on myös muita resursseja ja hän tuntee monia ihmisiä. Hän on keskustellut Lu Qin, Kimin toimitusjohtajan Yang Zhilinin, Horizon Yu Kain ja muiden kanssa. Hän ei vain ymmärrä tekoälyn ydinolemusta ja olennaista teknologiaa, vaan hän osaa myös ilmaista sen suosituin termein.

36Kr Auto: Kuinka paljon työvoimaa tarvitaan päästä päähän -mallin suunnitteluun? Kuinka monta henkilöä on tulevaisuuden älykkään ajotiimin keskikoko?

Jia Peng: Et ehkä tarvitse liikaa Teslalla on todella vähän eliittimallintekijöitä, ja visuaalisessa tiimissä on yhteensä vain 20 henkilöä. Tästä voi itse asiassa päätellä. Esimerkiksi OrinX-sirulla itse malli toimii 12-15 Hz:llä, mikä pohjimmiltaan määrää mallin parametrien lukumäärän ja sen, millaista mallirakennetta koulutuksessa käytetään se.

Lang Xianpeng: Tesla on äärimmäisempi, sillä ohjelmistoalgoritmiryhmässä on yli 200 ihmistä, mutta se valmistaa vain yhden sirun ja muutaman mallin. Emme voi olla yhtä täydellisiä kuin hän nyt, mutta tulemme silti olemaan monta kertaa häntä parempia. Koska sirualustamme ovat erilaisia ​​ja meillä on monia malleja, vaikka emme työllistäkään erityisen paljon ihmisiä, jokaisessa paikassa on silti joitain ihmisiä.

36Kr Auto: Pilvilaskentateho on suuri investointi tulevaisuuteen. Oletko harkinnut sen korvaamista kotimaisilla siruilla? Onko vaihtaminen vaikeaa?

Jia Peng: Horizonin J3 ja J5 käytettiin ensin auton päässä. Cloud kokeilee joitain kotimaisia ​​tuotteita, mutta suurin vaikeus tällä hetkellä on, että niiden ekologia ei ole niin hyvä. NVIDIAn CUDA-ekosysteemi on niin voittamaton, että olisi erittäin hankalaa sopeutua toiseen ekosysteemiin. Nyt haluan edelleen asettaa tehokkuuden etusijalle ja kiinnittää huomiota kotimaiseen edistymiseen. Vaihdot ja kokeilut ovat jo alkaneet.

36Kr Auto: Kun itse kehitetty älykäs ajosiru on julkaistu, mikä on päästä päähän -integraation vaikutus?

Jia Peng: Ohjelmiston ja laitteiston yhdistäminen tuottaa varmasti parempia tuloksia, ja Tesla on jo tuottanut prototyypin. Sirut ovat halvempia, laskentateho suurempi ja AD-tuki parempi He halusivat laajentaa parametreja 5-kertaiseksi FSD V12.5:ssä ja sitä laajennettiin. Tällä on suuria etuja.

Lang Xianpeng:Edellytyksenä on, että L3- ja L4-algoritmit on määritettävä.

36Kr Auto: Onko L4 autonomiselle ajolle aikapiste?

Lang Xianpeng: Vain 3-5 vuotta. Luovutimme ensin L3:n, joka on ponnahduslauta L4:lle. Ensinnäkin se antaa meille mahdollisuuden saada selkeämpi käsitys L4:n laskentateho- ja tietovaatimuksista, mukaan lukien tutkimusjärjestelmän ja suljetun silmukan perusominaisuudet.

Toiseksi tuotteiden osalta meidän on luotava keskinäinen luottamus ihmisten kanssa. Koska end-to-end itsessään on edelleen musta laatikko, ihmiset eivät edelleenkään luota järjestelmään. Sitten L3-tuotteiden avulla voit rakentaa hyvän luottamussuhteen ihmisten kanssa.

36Kr Auto: Monet tekoälyteknologiat ovat peräisin Piilaaksosta. Olen seurannut Teslaa, mutta Ideal tekee nyt myös huippuluokan tutkimusta, sen sijaan, että valitsisin sen väärä tekniikkapuu?

Lang Xianpeng:Meillä on jo täydellinen järjestelmä 3–5 vuoden päässä, mutta olemme jo alkaneet koskea siihen.

Tekoäly on todellakin jakautunut Kiinan ja Yhdysvaltojen välillä, ja Kiinassa on todella paljon kykyjä. Yritämme parhaamme löytääksemme parhaat nuoret. Esimerkiksi tänä vuonna rekrytoimme yli 240 koulua. jotka kaikki ovat QS:n 100 parhaan (maailman 100 parhaan yliopiston) joukossa.

Teslasta puhuminen: Opi Teslasta ja ohita Tesla

36Kr Auto: Jotkut sanovat, että ero kotimaisen ja Teslan älykkään ajon välillä on 2 vuotta.

Lang Xianpeng: Ainakaan. Emme kommentoi teknisiä ratkaisuja, koska Tesla ei ole kertonut paljon teknisistä ratkaisuistaan ​​viimeisen kahden vuoden aikana. Tuotekokemuksen suhteen olemme pohjimmiltaan sillä tasolla, jolla Tesla julkaisi juuri viime vuonna päästä päähän -version. Taukoa on noin puoli vuotta.

36Kr Auto: Tesla on myös kohdannut ongelmia, ja Musk sanoi, että on vähemmän tietoa ja vähemmän palautetta.

Lang Xianpeng:Nämä ovat eri vaiheita Kun kohtaamme ne, se tarkoittaa, että olemme siirtyneet seuraavaan vaiheeseen.

Jia Peng: Teslan suurin ongelma on nyt todentaminen. Näet, että v12.4 (Tesla FSD-versionumero) ei toiminut hyvin, ja sitten julkaistiin v12.5, jolloin parametrin määrä kasvoi 5-kertaiseksi. Luulen, että vahvistusvaihetta ei tehty erityisen hyvin. Kun malli julkaistiin, en tiennyt kuinka se toimisi, kun käyttäjät todella käyttävät sitä.

Siksi korostamme maailmanmalleja. Olemme oppineet nämä asiat ja meidän on suoritettava vahvistus etukäteen. Kuinka muuten malli voidaan todentaa kaikille maanteille, myös puistoyhteisöissä?

Jos katsot Teslan tekoälypäivää vuonna 2022, se on edelleen hyvin perinteinen simulaatio. Skaalautuvuus (skaalautuvuus) on liian huono tukemaan sen täyttä avaamista Pohjois-Amerikassa. Tässä vaiheessa olemme todellakin oppineet Teslasta. Siksi panostamme niin paljon tehdäksemme maailmanmalleja.

36Kr Auto: Onko mitään, mikä on mielestäsi vaikeaa päästä päähän -ratkaisun rakentamisprosessissa? Kuten tietotyökaluketju?

Jia Peng: Tietojoukkoa on rakennettu vuodesta 2019 lähtien, ja se on ainakin Kiinan paras. Data ja koulutus ovat itse asiassa rutiineja, ja niillä kaikilla on noudatettava paradigma. Tällä hetkellä todentaminen on suurin haaste.

Toinen on itse VLM, joka on vähitellen saamassa suurempaa roolia. Alussa sitä voidaan käyttää vain 5 prosentissa tapauksista, mutta myöhemmin se voi kohdata päästä päähän ylärajan, ja jäljellä oleva tuotekokemus riippuu VLM: stä. Tämä on haaste tulevaisuudessa.

Tämä eroaa myös Teslasta. Teimme VLM:n ja maailmanmallin, koska näimme Teslan ongelmat. V12.4-vahvistuksessa on ongelma Olemme ajaneet sillä Pohjois-Amerikassa kahdesti, joka kerta noin viikon ajan, sekä länsirannikolla että itärannikolla. Ilmeisesti se on hyvä länsirannikolla ja huono itärannikolla. Boston ja New York eivät ole niin hyviä, koska nämä kaksi kaupunkia ovat paljon monimutkaisempia kuin länsirannikko.

Itärannikolla Teslan keskimääräinen haltuunottoaste on melko korkea, ja ehkä jotkut päästä-päähän ylärajat ovat täällä. Joten kun teemme VLM:ää, haluamme rikkoa tämän katon. VLM:n yläraja on erittäin korkea, ja se (Tesla) on mahdollista ylittää tätä reittiä pitkin.