2024-09-25
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
voiko autonominen ajaminen todella toteutua?
ihmiskunta on käyttänyt lukemattomia aikaa ja rahaa autonomisen ajamisen kehittämiseen. nykyään toistuvat onnettomuudet, loputon rahanpoltto ja hidas edistyminen ovat aiheuttaneet monia hämmennystä ja kysymyksiä: onko kuljettajaton ajaminen huijausta vai onko ala jopa kuollut?
tämä toimiala on todella yksi jakautuneimmista toimialoista, joita olen koskaan nähnyt. jokaisella ryhmällä on erilaiset näkemykset, he katsovat toisiaan alaspäin ja syyttävät toisiaan, kun jumalia taistelevat, he kaikki kulkevat omalla tavallaan. ja kukistaa toisensa.
tuloksena on, että kuljettajaton ajaminen siirtyy kylmään talveen ennen vuotta 2024.
mutta tänä kylmänä talvena, kun musk väittää rekonstruoineensa teslan fsd:n "päästä päähän - tekoälyteknologian avulla" ja ilmoitti siirtyvänsä autonomiseen taksiteollisuuteen (robaxi), näyttää siltä, että uutta elinvoimaa ja toivoa.
voiko päästä päähän johtaa meidät kohti todellista kuljettajatonta ajamista? ovatko l2 ja l4 määritelty autonomisessa ajamisessa todella kaukana toisistaan? missä kuljettajaton tekniikka on kehittynyt nykyään? onko taistelu puhtaan näkemyksen ja multimodaalisuuden välillä todella loputon?
selvittääksemme, miten autonominen ajoteollisuus kehittyy, käytimme kolme kuukautta haastattelemalla globaalien markkinoiden huippuluokan itseohjautuvia yrityksiä, mukaan lukien waymon ja cruisen entiset ydintyöntekijät, entiset teslan fsd-insinöörit sekä ensi- ja jälkimarkkinasijoittajat. autonominen ajo-alalla on peräti kymmenen ammattilaista.
huomasimme, että toimiala on edelleen pirstoutunut, eikä alalla ole yksimielisyyttä monista teknisistä reiteistä.
tässä artikkelisarjassa tutkimme nykypäivän autonomisen ajotekniikan huippua useista eri näkökulmista, kuten havainnoista, algoritmeista, tuotteista, toiminnoista, taloudesta ja oikeudesta.
tässä artikkelissa puhumme ensin teknologiasta kattavasti ja seuraavassa numerossa analysoimme sitä toiminnallisesta ja taloudellisesta näkökulmasta.
1. mitä on autonominen ajaminen?
tehdään ensin käsitteellinen ero: mitä eroa on kuljettajattoman ajon ja autonomisen ajon välillä?
älykkyysasteen mukaan autonominen ajo on jaettu 6 tasoon l0:sta l5:een:
l0 tarkoittaa ei automaatiota, l1 tarkoittaa ajoavustusta, l2 tarkoittaa osittaista automaattiajoa, l3 tarkoittaa ehdollista automaattiajoa, l4 tarkoittaa erittäin automaattista ajoa ja l5 tarkoittaa täysautomaattista ajoa, eli todellista kuljettajatonta ajoa.
waymo ja cruise, joista mainitsimme myöhemmin, sekä hou xiaodin rakentamat miehittämättömät kuorma-autot kuuluvat kaikki l4-tasolle, mutta tesla robotaxi, jonka musk väittää, on l4.
siksi tällä alalla ihmiset puhuvat autonomisesta ajamisesta yleensä l4-yrityksiin, koska kukaan ei voi saavuttaa l5:tä, ja yleisesti ottaen autonominen ajo sisältää kaikki tasot ja on yleisempi.
katsotaanpa, kuinka autonominen ajoteollisuus sai alkunsa.
vaikka ihmiset alkoivat tutkia autonomista ajamista jo 100 vuotta sitten, on tunnustettu, että moderni autonominen ajaminen sai virallisesti alkunsa yhdysvaltain armeijan vuonna 2004 toteuttamasta darpa challenge -haasteesta.
useiden vuosien kehitystyön jälkeen muodostui perception-planning-controlin toiminnallinen linkki. havaintomoduuli sisältää havainnon ja ennustamisen.
havaintokerroksen on hankittava edessä olevat tieolosuhteet antureiden, kuten tutkan ja kameroiden, avulla, ennakoitava esineiden liikeradat ja luotava reaaliaikainen kartta ympäröivästä ympäristöstä, joka on yleinen lintuperspektiivikuva, jonka näemme autoissa ja kameroissa. koneet ja sitten välittää nämä tiedot suunnittelukerrokseen. järjestelmä määrittää nopeuden ja suunnan algoritmin perusteella ja siirretään lopuksi suorituksen ohjauskerrokseen vastaavan kaasun, jarrun ja ohjausvaihteen ohjaamiseksi.
myöhemmin, tekoälyn nousun myötä, ihmiset alkoivat antaa koneen oppia ajamaan itse. ensinnäkin, algoritmi ajaa simuloidussa digitaalisessa maailmassa, kun simulaatioharjoittelu saavuttaa tietyn tason .
kahden viime vuoden aikana, kun tesla sovelsi "päästä päähän" -ratkaisua fsd v12 -versioon, myös havainto-suunnittelu-ohjauksen toiminnallinen linkki on alkanut muuttua.
seuraavaksi keskitymme keskustelemaan autonomisen ajoteollisuuden kahdesta teknisestä reitistä havaintotasolla: puhdas visuaalinen koulu ja multimodaalinen fuusiokoulu. nämä kaksi ryhmää ovat taistelleet monta vuotta, ja jokaisella on omansa ansiot puhutaanpa heidän valituksistaan ja vihastaan.
2. havainto: pure vision vs. multimodaalinen fuusio
tällä hetkellä autoille on olemassa kaksi yleistä havaintoratkaisua.
ensimmäinen on monien yritysten käyttämä multimodaalinen fuusiotunnistinratkaisu, joka kokoaa ja sulattaa antureiden, kuten lidar-, millimetriaaltotutka-, ultraäänianturien, kameroiden ja inertiamittausyksiköiden keräämät tiedot ympäröivän ympäristön määrittämiseksi.
palatakseni edellisessä luvussa mainitsemaan darpa challenge -tapahtumaan, ensimmäisessä istunnossa vuonna 2004, vaikka yksikään ajoneuvo ei päässyt kisaan, kilpailija nimeltä david hall tajusi lidarin merkityksen kilpailun aikana, hänen yrityksensä velodyne perustettiin, alkoi siirtyä audiosta lidariin.
tuolloin lidar skannasi yhdellä viivalla ja pystyi mittaamaan etäisyyden vain yhteen suuntaan. david hall keksi 64-linjaisen mekaanisen pyörivän lidarin, joka pystyi skannaamaan ympäristöä 360 astetta.
myöhemmin hän otti tämän pyörivän lidarin osallistuakseen toiseen darpa challengeen vuonna 2005. lopulta auto, jonka päässä oli 5 lidaria, päätti kilpailun ja voitti mestaruuden.
mutta tämä ei ollut david hallin auto... hänen autonsa poistui puolivälissä mekaanisen vian vuoksi, mutta hänen suorituksensa sai kaikki ymmärtämään, että lidar on "plug-in".
kolmannessa darpa challengessa vuonna 2007 viisi kuudesta kilpailun päässeestä joukkueesta käytti velodynen lidaria. tässä vaiheessa lidarista on tullut suosittu autonomisen ajon teollisuudessa, ja velodynesta on tullut myös johtava yritys autoteollisuuden lidarissa.
zhang hang (risteilyn johtava tutkija):
nyt, oli se sitten cruise tai waymo, jotkut l4-pohjaiset ratkaisut perustuvat pääasiassa lidariin, joka voi saada suoraan sijaintitietoja. tässä tapauksessa itse algoritmin vaatimukset ovat suhteellisen alhaiset, ja sitten on monia this 3d -tietoja. voidaan saada suoraan antureiden kautta, mikä parantaa järjestelmän kestävyyttä ja turvallisuutta sekä helpottaa joitain pitkäjänteisiä ongelmia.
toinen tekninen osa on teslan edustama puhtaasti visuaalinen ratkaisu, joka luottaa vain kameroihin ympäristötietojen keräämiseen ja muuntaa sitten 2d-videot 3d-kartoiksi, jotka sisältävät esteitä ja ennusteita ympäröivästä ympäristöstä tiedot.
verrattuna suoraan 3d-karttoja luovaan lidar-ratkaisuun, puhtaalla visiolla on lisäprosessi 2d:n muuntamiseksi 3d:ksi. zhang hangin mielestä pelkkä "video"-harjoitusdatan luottaminen, josta puuttuu 3d-tieto, tuo tiettyjä haasteita turvallisuudelle.
zhang hang (risteilyn johtava tutkija):
3d-tiedon puutteen oppiminen vaatii suuren määrän harjoitusdataa. tässä tapauksessa valvonnan puute koska vertailukohdetta ei ole, on vaikea saada todellista pohjaa. jos se on kokonaan tämän puolivalvonnan kautta, mielestäni on vaikeampaa saavuttaa järjestelmäturvallisuutta oppimismenetelmän perusteella. luulen, että teslan päätarkoituksena on hallita kustannuksia, mukaan lukien joidenkin vaihteiden vaihtomekanismien muokkaaminen, kaikki säästääkseen kustannuksia joissakin osissa.
mutta teslan entisen tekoälyinsinöörin yu zhenhuan mukaan puhtaan näön valitseminen ei tarkoita vain kustannussäästöjä.
1. enemmän kaaosta?
yu zhenhua (entinen teslan tekoälyinsinööri):
itse asiassa teslan alkuperäisessä autopilottijärjestelmässä oli millimetriaaltotutka sensor-fuusio on itse asiassa erittäin monimutkainen algoritmi, mutta se ei välttämättä ole hyvä, kun se on tehty.
minulla oli tuolloin auto, joka oli yksi viimeisistä autoista, jossa oli millimetriaaltotutka. vuonna 2023 autolleni tehtiin huolto ja huoltoinsinööri poisti automaattisesti tutkani. mikä on tämän asian johtopäätös? millimetriaaltotutkan poistaminen ei johdu kustannussyistä, sillä autossani on jo millimetriaaltotutka. perimmäinen syy on se, että puhdas näkö on ylittänyt millimetriaaltotutkan. joten tesla tekee vähennyslaskua ja poistaa joitain tarpeettomia asioita, jotka hänen mielestään ovat tarpeettomia tai hankalia asioita.
yu zhenhua uskoo,jos fuusioalgoritmia ei tehdä hyvin tai jos puhtaalla näkemisellä voidaan saavuttaa tarpeeksi hyviä tuloksia, useammista antureista tulee taakka.
monet haastattelemamme l4-ammattilaiset olivat myös samaa mieltä siitä, että enemmän tietoa ei ole parempi. päinvastoin, liian paljon antureiden keräämää virheellistä tietoa lisää algoritmin taakkaa.
onko siis mahdollista luottaa pelkästään kameraanturiin, jota musk on aina kannattanut?
2. vähemmän on enemmän?
musk sanoi, että koska ihmiset voivat ajaa vain kahdella silmällä, autot voivat myös saavuttaa autonomisen ajon pelkän kuvainformaation perusteella. alan huoli puhtaasta visuaalisuudesta on kuitenkin aina ollut visuaalinen petos, joka on todellakin tuonut vähemmän ongelmia.
esimerkiksi tesla tunnistaa valkoisen kuorma-auton taivaan ja kuun keltaiseksi valoksi tai ideal tunnistaa mainostaulun sisällön autoksi, mikä aiheuttaa onnettomuuksia, kuten äkillisiä jarrutuksia ja takatörmäyksiä suurilla nopeuksilla.
tarkoittaako nämä tapaukset, että puhtailla visuaalisilla ratkaisuilla ilman syvyystietoa on luontaisia puutteita?
yu zhenhua (entinen teslan tekoälyinsinööri):
useat tietovirrat voivat todellakin tarjota enemmän tietoa, mutta sinun on vastattava kysymykseen, eikö kameralla itsellään ole tarpeeksi tietoa? vai onko algoritmin kyky louhia tietoa riittämätön?
esimerkiksi äkillisesti jarrutettaessa tai turhautuneessa ajettaessa kaupunkiteillä perimmäinen syy on itse asiassa sen riittämätön arvio ympäröivien kohteiden nopeudesta ja sen kulmasta. jos tämä on syy, niin lidar on todellakin paljon parempi kuin kamerat, koska se pystyy antaa jos annat suorempaa tietoa, kamera itse antaa sinulle tietoa, mutta algoritmimme ei ole tarpeeksi hyvä kaivaamaan esiin sellaisia tietoja.
yu zhenhua ei usko, että visuaalisen petoksen perimmäinen syy on riittämätön tieto kamerasta, vaan että algoritmi ei riitä käsittelemään tai louhimaan kameran antamaa tietoa. hän uskoo, että varsinkin teslan fsd v12 -algoritmin lanseerauksen jälkeen on todistettu, että kun algoritmia on paljon optimoitu, kameratietojen louhinta ja käsittely on parantunut merkittävästi.
yu zhenhua (entinen teslan tekoälyinsinööri):
nykypäivän fsd v12 ei ole täydellinen, ongelmia on monia, mutta en ole toistaiseksi löytänyt mikä ongelma johtuu riittämättömistä antureista. tietenkin ennen v12:ta monet ongelmat johtuivat riittämättömistä antureista, mutta nykyisessä v12:ssa tätä ongelmaa ei ole.
l4-alan harjoittajilla on kuitenkin erilainen näkökulma. he uskovat, että kameroilla on luonnollisia haittoja.
zhang hang (risteilyn johtava tutkija):
mielestäni se on vaikeaa, enkä usko, että se on välttämättä ongelma itse algoritmissa.
ensinnäkin kamera itsessään ei ole niin monimutkainen kuin ihmissilmä. jokaisella kameralla on joitain parametreja ja sen rajoituksia.
sitten on itse algoritmi. ihmisten ei tarvitse tietää, mitkä autot ja mitkä jalankulkijat voivat vaikuttaa autoni toimintaan pisteet riittävät, enkä tarvitse paljon laskentatehoa. tämä korkeus ei ehkä ole mahdollista saavuttaa algoritmien avulla lyhyellä aikavälillä.
l4-tutkimusta tekevä zhang hang uskoo, että kamerat eivät vastaa ihmissilmää. pääsyynä on se, että kameran polttoväli ja pikselit ovat kiinteät, kun taas ihmissilmä on erittäin tarkka ja pystyy zoomaamaan automaattisesti. samanaikaisesti ihmisen hyppäävää ajattelutapaa ei voida soveltaa tietokoneisiin lyhyellä aikavälillä, joten lidaria voidaan käyttää täydentämään kameroiden puutteita.
markkinoilla on kuitenkin muitakin mielipiteitä, joiden mukaan visuaalisen tiedon lisäksi muut anturit tuovat häiriötietoa.
esimerkiksi lidarissa on myös omat puutteensa, koska se käyttää laseretäisyyttä, kun se kohtaa joitain heijastavia esineitä, sadetta tai lunta tai muiden autojen lähettämiä lasereita, se häiritsee lidar:ia ja aiheuttaa lopulta illuusiovaikutuksia.
liu bingyan (kargo softwaren johtaja):
olen erittäin luja, puhdas visuaalinen ihminen. tämän maailman tiet on suunniteltu näkemisen lisäksi tieto aiheuttaa häiriöitä, ja mikä on sen todellinen arvo, millainen jakelu se on? uskon, että visuaalisuuden parantuessa se saattaa olla täysin päinvastainen.
jos voidaan kehittää usean sensorin fuusioalgoritmi, joka mahdollistaa lidar- ja kuvatietojen todentamisen, järjestelmän turvallisuutta voidaan parantaa entisestään.
hou xiaodi ehdotti elävää metaforaa:kun kaksi saman tason opiskelijaa suorittaa kokeen, laskimen käyttäjällä on lopulta helpompi olla.
keskustelua puhtaan vision ja lidar-pohjaisten multimodaalisten fuusioratkaisujen välillä on käyty useita vuosia, eikä vastausta näytä löytyvän lyhyellä aikavälillä. taijoillekin startupeille reitti ei ole ollenkaan niin tärkeä, mutta kustannus- ja taloustilit ovat tärkeimpiä.
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
minua pidettiin ennen visuaalisena ihmisenä, koska lidar ei ollut tuolloin saatavilla, joten jouduimme etsimään lisää visuaalisia ratkaisuja.
en myöskään vastusta lidaria;milloin lidarista tuli halpa, join ensimmäisenä?lidar on nyt todella halpa, joten olen myös jonossa ostaakseni lidarin. niin kauan kuin tämän laitteen hinta on riittävän alhainen ja niin kauan kuin tämä laite voi tarjota meille riittävän arvokasta tietoa informaatioteorian näkökulmasta, meidän tulee käyttää sitä.
david ("big horses talking about technology" -elokuvan ankkuri):
kiinan autonominen ajopiiri sai nopeasti nämä laitteet, kuten lidar ja millimetriaaltotutka, saataville kaalihinnoilla. pitäisikö tässä tilassa silti tehdä puhdasta visiota kuten tesla? itse asiassa monet yritykset epäröivät nyt, pitäisikö minun ostaa solid-state-lidar yli 1000 yuanilla, vai pitäisikö minun käyttää puhdasta visiota, mutta se aiheuttaa paljon laskentatehoa.
yu zhenhua (entinen teslan tekoälyinsinööri):
mielestäni 1000 yuania on liian kallista, eikä tesla ole edes halukas käyttämään sadeanturia.
wang chensheng (entinen teslan hankintajohtaja):
mutta luulen kuitenkin, että kun toimitusketjun laajuus kasvaa ja kustannukset laskevat merkittävästi, kun lidar voi saavuttaa kameroiden hintaa vastaavan hinnan, erityisesti päästä päähän -sovelluksen skenaariossa, onko puhdas visio edelleen ainutlaatuinen tie?
3. tee parannus?
mielenkiintoista on, että kun lidarin hinta on laskenut merkittävästi, teollisuus on alkanut olla eri mieltä siitä, käyttääkö teslan tuleva itseajava taksi lidaria.
esimerkiksi zhang hang uskoo, että koska robotaxi ei vaadi ihmisen väliintuloa, ja jos jokin menee pieleen, yrityksen on oltava vastuussa, tesla voi valita konservatiivisemman reitin ja käyttää lidaria, jota se kerran katsoi alaspäin.
zhang hang (risteilyn johtava tutkija):
varsinkin kun sen on oltava vastuussa yritysten onnettomuuksista, sen on oltava konservatiivisempi, ja mielestäni lisäanturi saattaa tarvita. tästä näkökulmasta tesla saattaa ottaa käyttöön joitain tekniikoita, joita se aiemmin halveksii.niin kauan kuin tämä asia on hyödyllinen ja voi saavuttaa l4-tavoitteensa, se ottaa sen vähitellen käyttöön.
äskettäin olemme myös havainneet, että tesla harkitsee myös joitain l4:n ja l5:n puolia, ja se puhuu myös yhteistyöstä joidenkin tämän lidarin valmistajien kanssa, joten voi olla, että kaikki saavuttavat saman tavoitteen eri polkuja.
tänä vuonna lidar-valmistaja luminar julkaisi ensimmäisen vuosineljänneksen taloudellisen raportin, joka osoitti, että teslan tilaukset nousivat 10 prosenttiin, mikä tekee siitä sen suurimman asiakkaan. mutta yu zhenhua oli eri mieltä ja ajatteli, ettei tämä ollut mitään uutta.
yu zhenhua (entinen teslan tekoälyinsinööri):
ensinnäkin se ei todellakaan ole tarkoitettu lidarin käyttöön tulevissa massatuotantoautoissa, koska luminarin kokonaistulot ensimmäisellä vuosineljänneksellä näyttävät olevan 20 miljoonaa dollaria ja 10% on 2 miljoonaa, mikä ei riitä useiden autojen asentamiseen. lidars. itse asiassa ei ole mikään salaisuus, että teslan suunnitteluajoneuvot ja testiajoneuvot on varustettu lidarilla. lidaria käytetään perustotuuden (todellisen arvon datan) keräämiseen neuroverkkojen harjoittelua varten, koska ihmiset eivät voi merkitä kuinka monta metriä kohde on sinusta. merkinnässä on käytettävä erityisiä antureita.
mutta miksi lumina julkisti tämän ensimmäisellä vuosineljänneksellä, olen itse asiassa hyvin hämmentynyt, koska myös musk vastasi tuolloin sanoen, että kun olemme saavuttaneet v12:n, emme tarvitse todellista arvodataa, koska se on päästä päähän ja vie verkkoa. tämä on v11-aikakauden kysymys. saatan ajatella, että tässä on joitain väärinkäsityksiä, toisin sanoen talousraporteista tai taloussäännöistä.
vaikka tällä hetkellä on epävarmaa, varustetaanko teslan tuleva robotaxi lidarilla, yksi asia on varmaa, että teslan nykyisellä tunnistuskonfiguraatiolla turvallisuus ei riitä l4:n saavuttamiseen tai robotaxin käyttämiseen.
liu bingyan (kargo softwaren johtaja):
olen hyvin varma, että nykyisissä tesla-malleissa on erittäin selkeät kuolleet kulmat, jotka ovat kuolleita kulmia, joihin ei ole visuaalisesti pääsyä, ja tämä kuollut piste aiheuttaa hänen seuraavaa, jos hän haluaa saavuttaa äärimmäisen, olipa kyseessä l4 tai l5 autonominen ajo. auton on ratkaistava tämä kuolleen kulman ongelma.
puramme teslan uusimman päästä päähän -teknologian päivityksen yksityiskohtaisesti luvuissa 3 ja 4, samoin kuin spekulaatioita robotaxin yksityiskohdista, jotka julkistetaan lokakuussa. seuraavaksi keskustellaan ensin toisesta tärkeästä havaintotekniikasta: erittäin tarkoista kartoista.
4. ajaton?
lidarin lisäksi erittäin tarkat kartat ovat myös merkittävä kustannuslähde autonomisen ajon tunnistuspäässä.
erittäin tarkat kartat keräävät tietietoja etukäteen, vähentävät havaintomoduuliin kohdistuvaa painetta piirtää 3d-karttoja ja parantavat tarkkuutta.
sattumalta ensimmäinen henkilö, joka mainosti erittäin tarkkoja karttoja, oli sebastian thrun, toisen darpa challengen vuonna 2005 voittaja, auton omistaja, jolla oli viisi lidaria päässään.
vuoden 2004 darpa challengen aikana google valmisteli "street view" -projektia. googlen perustaja larry page kävi henkilökohtaisesti kilpailusivustolla kartan piirtäminen annettiin hänelle.
prosessin aikana thrun ja page tajusivat yhtäkkiä,jos on kartta, joka pystyy tallentamaan tarkasti kaikki kaistaviivat, liikennemerkit, liikennevalot ja muut tietiedot, siitä on suuri apu autonomiseen ajamiseen., joka vahvistaa myös korkean tarkkuuden karttojen tärkeän aseman autonomisissa ajoprojekteissa.
korkean tarkkuuden karttojen tuottaminen on kuitenkin erittäin kallista. itseohjautuville yrityksille tarkkuuskarttojen kerääminen maksaa keskimäärin 5 000 dollaria kilometriltä, jos ne haluavat kattaa 6,6 miljoonaa kilometriä teitä nousee 3,3 miljardiin dollariin.
yhdessä kartan toistuvien ylläpitokustannusten kanssa loppukulutus on käsittämättömän tähtitieteellistä.
monet autoyritykset mainostavat nyt karttattomia ratkaisuja, jotka hylkäävät erittäin tarkkoja karttoja ja käyttävät sen sijaan ajoneuvoja ympäristökarttojen rakentamiseen paikallisesti.
anonyymisti haastattelemamme autonomisen ajo-insinööri sanoi, että nämä vertailut ja julkisuus johtuvat enemmän liiketoimintamallista.autoyhtiöille erittäin tarkoista kartoista luopuminen voi tehokkaasti vähentää kustannuksia, joten se ei tarkoita, että erittäin tarkkojen karttojen luopuminen johtaisi korkeampaan tekniseen tasoon.
anonyymi vastaaja (l4-insinööri):
huaweilla on myös ihanne. heidän ratkaisunsa on massatuotettu auto.
valtavirran korkean tarkkuuden pääkynnys on, että se vaatii karttojen keräämisprosessin. tämä karttakeräysprosessi on itse asiassa suhteellisen aikaa vievä ja työvoimavaltainen, ja se vaatii myös ammattitaitoa.
joten jos harjoitat autojen massatuotantoa, et voi sanoa, että minulla on omistettu karttakokoelma-auto ja että olen matkustanut ympäri kiinan. tämä on epärealistista.
l2-yritykset, kuten tesla, huawei ja ideal, hylkäsivät korkean tarkkuuden kartat, koska ne eivät voineet kattaa jokaista katua ja kujaa.
kun waymo ja cruise tekivät tämän, robotaxin l4-yhtiö päätti jatkaa erittäin tarkkojen karttojen käyttöä, koska he huomasivat, ettämeidän tarvitsee vain kattaa jotkin tärkeimmät kaupungit vangitaksemme tarpeeksi markkinoita.
siksi, onko käyttää korkean tarkkuuden karttoja tuleerobotaxin taloushallinnon ongelma ei ole tekninen ongelma.
minfa wang (entinen waymon vanhempi koneoppimisinsinööri):
jos tarkastelet vain robotaxin liiketoimintamallia ja jaat robotan kysynnän yhdysvalloissa, huomaat, että viiden suurimman kaupungin osuus on jo puolet yhdysvaltojen kaupallisesta määrästä missä tahansa yhdysvalloissa. itse asiassa sinulla on jo melko suuret markkinat.
vastaavasti toinen haastattelemamme vieras, joka työskentelee l4-autoilla itseohjautuvilla kuorma-autoilla, kertoi, että jos he haluavat laajentaa liikennöintireittejään eli laajentaa erittäin tarkkojen karttojen kattavuutta, heidän on ensin mitattava, onko tämä reitti kannattava. tekee vain rahaa tappiolla.
tällaisen keskustelukierroksen jälkeen alalla ei ole yhtenäistä näkemystä havaintopuolella aivan kuten hou xiaodi sanoi, kissa on hyvä kissa, jos se nappaa hiiriä.
keskitytään seuraavaksi viimeaikaiseen edistykseen autonomisissa ajoalgoritmeissa, joihin kaikki ovat viime aikoina kiinnittäneet erityistä huomiota, erityisesti "päästä päähän", jota tesla on äskettäin edistänyt. mitä tekniikkaa se on? muuttaako se todella autonomisen ajoteollisuuden suuntaa?
3. algoritmi: onko päästä päähän autonomisen ajon tulevaisuus?
1. mitä perinne on?
perinteinen autonomisen ajon toimintalinkki on ensin aistia, ennustaa, sitten suunnitella ja lopulta ohjata.
havaintomoduulin on ensin tunnistettava tie antureiden, kuten kameroiden ja tutkien, avulla, käännettävä nämä tiedot koneen näkemälle kielelle ja välitettävä se ennustemoduulille.
ennustemalli arvioi muiden ajoneuvojen ja jalankulkijoiden ajoradat, välittää tämän tiedon suunnittelumoduulille pienimmän riskin omaavan polun löytämiseksi ja välittää lopuksi ohjaussignaalin ohjausjärjestelmälle.
tällä hetkellä algoritmia ohjaa pääasiassa "sääntökanta" insinöörien on jatkuvasti kirjoitettava erilaisia sääntöjä, kuten hidastaminen jalankulkijoiden kohtaamisen yhteydessä, pysähtyminen punaisiin valoihin jne. eri tilanteiden huomioimiseksi sääntöpohja. sinun on katettava kaikki mahdollisuudet niin paljon kuin mahdollista, ja vastaavasti koodi on erittäin, hyvin pitkä.
mitä ongelmia tällaisessa algoritmissa on?
suurin ongelma on, että järjestelmä on jaettu eri moduuleihin, mutta tiedonsiirto moduulien välillä katkeaa, jos alavirta ei saa kattavaa tietoa, ennustamisen ja suunnittelun vaikeus kasvaa.
yksinkertaisen ja helposti ymmärrettävän esimerkin antamiseksi kaikki ovat kuulleet monen pelaajan teleportaatiopelistä, eikö niin? 10 henkilöä toimittaa lauseen alusta loppuun, mutta usein yksityiskohdat katoavat tai peukaloidaan toimitusprosessin aikana useiden ihmisten toimesta, jolloin merkitys on täysin erilainen, kun se saavuttaa viimeisen henkilön.
vastaavasti perinteisessä sääntöpohjaisessa mallissa, jos ylemmän kerroksen moduuli ei toimi tarpeeksi hyvin, se vaikuttaa seuraavan kerroksen suorituskykyyn.
toinen haittapuoli on, että säännöt ovat kaikki ihmisten suunnittelemia ja määrittelemiä, mutta rajoitetut säännöt eivät voi kattaa loputtomasti mahdollisia tosielämän tilanteita joillekin harvinaisille ja helposti huomiotta jääville ongelmille. tätä kutsutaan nimellä ". "pitkähäntäkoteloa" kutsutaan myös "kulmakoteloksi", mikä johtaa erittäin korkeisiin kustannuksiin laajamittaisessa toteutuksessa.
yu zhenhua (entinen teslan tekoälyinsinööri):
toinen asia on, että kun se on jaettu kahteen moduuliin, tämä tekniikka on mielestäni vaikea skaalata miksi? joka kerta kun lisäät uuden tehtävän realistiseen monimutkaiseen kohtaukseen, sinun on lisättävä uusia käyttöliittymiä ja sinun on muutettava havainto- ja ohjaussuunnittelua.
otetaan esimerkiksi tesla. muutama vuosi sitten nhtsa (u.s. transportation safety administration) vaati teslaa havaitsemaan hätäajoneuvot, kuten paloautot ja ambulanssit tämä on vain yksi tehtävä. sinun on laajennettava sitä. noin 6 000 insinööriä, koska sinulle tulee niin paljon uusia tehtäviä, mitä monimutkaisempi ympäristö, sitä enemmän tehtäviä ei mielestäni ole.
david ("big horses talking about technology" -elokuvan ankkuri):
tämä menetelmä on vielä suhteellisen vanhanaikainen, vaikka se näyttääkin olevan joustavampi menetelmä robotaxi-teollisuudelle, mutta se ei pysty tulevaisuudessa vastaamaan henkilöautojen ja miljoonien ajoneuvojen tarpeisiin ympäri maailmaa.
mitkä ovat ratkaisut näihin ongelmiin? tällä hetkellä meidän on puhuttava "päästä loppuun".
2. uudet supertähdet
itseohjautuvan ajamisen alalla "päästä päähän" nykyinen valtavirran määritelmä on:anturin keräämä tieto välitetään suureen hermoverkkoon perustuvaan malliin ilman käsittelyä ja ohjaustulokset tulostetaan suoraan.
toisin sanoen ei tarvitse kirjoittaa manuaalisesti erilaisia sääntöjä ja antaa algoritmin oppia ajamaan itse sille syötettyjen tietojen mukaan.
yu zhenhua (entinen teslan tekoälyinsinööri):
koska me ihmiset ajaessamme emme arvioi tietyn auton nopeutta ja kulmaa mielessämme. teet päätöksesi alitajuisesti monimutkaisen ympäristön kautta.
ajattelulogiikka "algoritmien tekeminen enemmän ihmisten kaltaisille, koska ihmiset toimivat näin" on täsmälleen muskin suuntaa teslan johtamiseen. ei ole ihme, miksi "päästä päähän" -tekniikka ei ole uusi autonomisessa ajamisessa tesla.
vaikka tesla julkaisee fsd v12:n käyttämällä "päästä päähän" ensimmäistä kertaa vuoden 2023 lopussa, "päästä päähän" ei ole mitään uutta autonomisessa ajomaailmassa. itse asiassa jo vuonna 2016 nvidialla oli paperi, jossa ehdotettiin "päästä päähän".
nyt "end-to-end" on myös jaettu kahteen tyyppiin. yksi on korvata jotkut moduulit neuroverkoilla tämä "päästä päähän" on vain liiallinen muoto, ei täydellinen jokainen moduuli tiedon siirtämiseksi niiden välillä on vielä määritettävä erilaisia rajapintoja, mikä aiheuttaa tietojen menetyksen.
yleisnäkymässä vain silloin, kun useita moduuleja on integroitu kokonaisuudeksi ja havaintokerroksen, ennustekerroksen ja suunnittelukerroksen määritelmät on poistettu, sitä voidaan pitää puhtaana "päästä päähän".
vuonna 2023 cvpr:n paras paperi "planning-oriented autonomous driving" ehdotti, että aikaisempi "end-to-end" joko toimi vain joissakin moduuleissa tai vaatisi joidenkin komponenttien lisäämistä järjestelmään.
tässä artikkelissa ehdotetaan uniad-malliarkkitehtuuria, joka on ensimmäinen kerta, kun kaikki tunnistus-, ennustus- ja suunnittelumoduulit on integroitu transformeriin perustuvaan päästä päähän -verkkokehykseen.
perinteiseen sääntöpohjaiseen (sääntöpohjaiseen) suorituslinkkiin verrattuna "päästä päähän" ei enää vaadita algoritmi-insinöörejä parantamaan toistuvasti sääntöpohjaa, joten kun musk julkaisi fsd v12:n, hän väitti, että "sen koodi on kasvanut 300 000 riviä se vähennettiin 2 000 riviin."
vaikka tesla ei keksi "päästä päähän" -tekniikkaa autonomisessa ajamisessa, tesla oli todellakin ensimmäinen yritys, joka kehitti neuroverkkojen "päästä päähän" -teknologian ja toi sen valtavirran markkinoille.
3. "päästä päähän" -edut
marraskuussa 2023 tesla julkaisi ensimmäisen testiversion fsd v12:sta, mutta se oli avoinna vain valituille työntekijöille. vuoden 2024 alkuun mennessä tesla alkaa avata fsd v12 -versiota kaikille teslan omistajille yhdysvalloissa, ja jokaisella omistajalla on kuukauden ilmainen kokeilujakso.
fsd v12:n julkaisun jälkeen se aiheutti jonkin aikaa kohua käyttäjäkokemuksen perusteella useimpien mielestä teslan fsd:n toiminta on aikaisempaa parempi on "ensimmäinen autonomisen ajamisen maailmassa".
david ("big horses talking about technology" -elokuvan ankkuri):
se, mikä todella saa minut tuntemaan edistyneeni, on suunnittelu. esimerkiksi liikenneympyröissä on melko vaikeaa ylittää liikenneympyrä perinteiseen suunnittelusuunnassa, koska edessäsi olevan auton täytyy jäädä kiinni, ja sinä. on poistuttava liikenneympyrästä kuinka asettaa keskimmäinen prioriteetti?
vaikka asetat prioriteetin, kuinka kaukana sinun pitäisi pysyä edessäsi ja vieressäsi olevasta autosta, ennen kuin pääset ulos. tämä on itse asiassa erittäin monimutkainen logiikka, mutta sen suorituskyky fsd:n uudessa versiossa todella tekee minusta tuntuu hämmästyttävältä. tämä on suuri yllätys.
monet ihmiset, jotka ovat kokeneet fsd v12:n, sanoivat, että tämä järjestelmä, joka oppii ihmisen ajotiedoista, on hyvin ihmismäistä ajotyyliä, eikä siinä enää ole mekaanisten algoritmien aiheuttamaa turhautumista.
mutta samaan aikaan jotkut vieraat ajattelivat sen koettuaan,fsd v12 ei ole niin hyvä, että ihmisten pitäisi käyttää sitä, ja sen ja l4:n välillä on edelleen tietty ero.
justin mok (perhetoimiston sijoitusjohtaja):
mutta se ei ole yhtä hyvä kuin gpt4, eikä se ole niin hyvä, että minun on käytettävä tätä asiaa tai että käytän sitä välittömästi, ja se voi olla sopiva käytettäväksi monissa skenaarioissani.
minfa wang (entinen waymon vanhempi koneoppimisinsinööri):
sen suorituskyky on suhteellisen hyvä moottoritiellä, mutta kaduilla mielestäni se on periaatteessa otettava käsin noin 5 mailin välein.
varsinkin siinä, mitä me kutsumme suojaamattomaksi vasemmalle käännökseksi (suojaamaton vasen käännös), se on suhteellisen helppo tehdä, mikä saa minusta tuntemaan, että se ei ole kovin turvallista autonominen ajo on vielä kaukana.
olen myös itse kokenut fsd 12.4.4 -version verrattuna l4-ajoneuvoihin, kuten waymo, nykyinen tesla fsd pelottaa minua edelleen tiettyinä aikoina tai käyttäytyy joskus käsittämättömällä tavalla.
esimerkiksi oikealle käännettäessä, koska sen kääntösäde oli liian suuri, se melkein osui vastaantulevaan autoon, joten jouduin ottamaan käsin.
suorituskyvyn näkökulmasta "päästä päähän" fsd v12:ssa on vielä parantamisen varaa.
ensinnäkin se voi tehdä kokonaisjärjestelmästä yksinkertaisemman.sääntöpohjan poistamisen jälkeen sinun tarvitsee vain lisätä jatkuvasti koulutustapauksia parantaaksesi mallin suorituskykyä entisestään, ja myös ylläpito- ja päivityskustannukset pienenevät merkittävästi.
toiseksi säästää työkustannuksia.koska "päästä päähän" ei enää nojaudu monimutkaiseen sääntöpohjaan, ei tarvitse ottaa käyttöön suurta kehitystiimiä tai edes luottaa asiantuntijoihin.
kolmanneksi se voi saavuttaa laajemman edistämisen.voit nähdä, että tällä hetkellä l4-yritykset voivat toimia vain rajoitetuilla alueilla sääntely- ja lisenssirajoituksista huolimatta, koska se ei ole "päästä päähän" -ratkaisu ja se on optimoitava tietyille alueille ja "päästä päähän" " pystyy käsittelemään kaikki tieolosuhteet. , enemmän kuin "universaali" kuljettaja, mikä on yksi syistä, miksi tesla fsd v12:ta verrataan chatgpt:hen.
koska "päästä päähän" on niin monia etuja, voiko se ratkaista autonomisen ajamisen tällä hetkellä kohtaamat tekniset ongelmat?
4. musta laatikko malli
monet haastattelemamme vieraat uskoivat, ettätässä vaiheessa end-to-end-reitin kehittäminen on tunnustettu trendi autonomisen ajon alalla, mutta ongelmia on edelleen paljon.
zhang hang (risteilyn johtava tutkija):
mielestäni tämä suunta on oikea. on mahdotonta tehdä laajamittaista l4-ratkaisua koko ajan korjaamalla. loppuun asti, joten nyt on ristiriitainen ajankohta.
se, miksi nykyinen päästä päähän on edelleen kaukana l4:stä, alkaa sen epävarmuudesta.
päästä päähän on kuin musta laatikko, joka tuo lisää epävarmuutta.
insinöörit eivät esimerkiksi voi tarkistaa, onko malli oppinut syötetietotapaukset, tai kun he törmäävät virheeseen, he eivät voi paikantaa, mikä linkki aiheutti ongelman tai aiheuttaako äskettäin lisätty data opitun tiedon unohtamisen tai korvaamisen. , tätä tilannetta kutsutaan katastrofaaliseksi unohtamiseksi.
esimerkiksi tesla fsd 12.4.2 -versio on tuotettu sisäisesti kauan sitten, mutta sen levittäminen suuressa mittakaavassa kesti kauan, koska syötettävä data sisälsi paljon manuaalisesti tehtyjä videoita otti haltuunsa, oli vaikeaa. mallin taso on taantunut.
koska päästä päähän -periaatteen olemus on jäljittely, niin jos kohdatussa tilanteessa sattuu olemaan samankaltaisia tapauksia harjoitustiedoissa, se toimii erittäin hyvin, mutta jos se ylittää olemassa olevat vertailutapaukset, suorituskyky on huonompi, eli sanotaan, päästä-päähän on erittäin korkeat vaatimukset harjoitustietojen määrälle ja tapausten rikkaudelle.
zhang hang (risteilyn johtava tutkija):
kun liikenneristeyksessä palaa punainen valo, se on niin yksinkertainen sääntö.
mutta jos se on täysin päästä päähän -malli, se perustuu täysin oppimiseen. loppujen lopuksi hänen on todella vaikeaa oppia tällä tavalla. joten luulen, että päästä päähän l4:n välillä on vielä suuri ero lyhyessä ajassa. mielestäni tämä algoritmi on epäkypsä.
liu bingyan (kargo softwaren johtaja):
sinulla ei ole tiukkoja sääntöjä, mutta hän voi yrittää tehdä kaikki asettamasi asiat, joita ei voida tehdä. joten simulaatiossa tulee olemaan paljon otsatörmäyksiä.
samaan aikaan päästä päähän tuoma selittämättömyys huolestuttaa myös joitain ihmisiä.
ns. selittämättömyys tarkoittaa, että minkä tahansa painon, solmun tai kerrosten lukumäärän muuttaminen algoritmimallissa vaikuttaa mallin suorituskykyyn arvaamattomalla tavalla.
päinvastoin on tulkittavuus esimerkiksi sääntöpohjaisessa tilassa insinöörit ovat kirjoittaneet säännön, että "voit jatkaa ajamista, kun ohi kulkee muovipussi", joten meidän ei tarvitse huolehtia äkillisistä muutoksista tässä tilanteessa. no, paina jarrua.
liu bingyan (kargo softwaren johtaja):
voit nähdä, että v12:ssa näytön näyttö on paljon parempi, mutta mistä tämä niin sanottu päästä päähän -näyttö tulee? jos tämä näyttö on peräisin alkuperäisestä mallista, yksi asiaan liittyvistä ongelmista on se, että olemme itse asiassa lisänneet tähän malliin keinotekoisesti määriteltyjä rajapintoja, jotta voit poimia nämä tiedot tietystä kohdasta mallissa.
toinen, mikä on mielestäni vielä pelottavampaa, on se, että tämä näyttö kulkee aivan eri polulla. se tarkoittaa myös sitä, että auto näyttää, että edessä on kuorma-auto jos tämä olisi hyvin, hyvin pelottavaa nähdä auto sen edessä, mutta et ole varma, ettei se törmää siihen.
itse asiassa epäilen, onko se todella päästä päähän, tai en ehkä epäile sitä, mutta tässä voi olla muita vaaroja.
wang chensheng (entinen teslan hankintajohtaja):
joten autonomisen ajamisen kaltaisilla aloilla, joilla on niin korkeat turvallisuusvaatimukset, onko kokonaisvaltaisen mallin tuoma selittämättömyys kolikon toinen puoli?
koska tesla ei ole vielä julkistanut fsd v12 -teknologiaa, emme tiedä, käyttääkö fsd monimoduulistrategiaa, mutta huomasimme, ettäjotkut auton omistajat ovat kohdanneet tapauksia, joissa näytön näyttö ei vastaa todellista toimintaa.
esimerkiksi ajoneuvon rakentama ilmakuva osoitti, että joku oli edessä, mutta se ei osoittanut merkkejä jarrutuksesta, vaan jatkoi ajoa .
vaikka tämä tapaus voidaan nähdä, että päästä päähän -algoritmin mukaan ylemmän kerroksen virheet eivät vaikuta alemman tason päätöksenteon etuihin, se osoittaa myös, että suunnittelukerros ei toisinaan tunnista havaintokerroksen tuloksia. , joka vahvistaa liu bingyanin huolen.
tuleeko selittämättömyydestä suuri ongelma, joka estää päästä-päähän kehitystä? seuraavaksi tulee kolmas näkemämme konflikti.
yu zhenhua (entinen teslan tekoälyinsinööri):
luulen niin,tekoälyn erittäin vakava ongelma on, että sen teoreettinen luonne on paljon jäljessä.
tekoäly ei kerro, toimiiko tämä varmasti vai ei. siksi se on kokeellinen aihe. sitä ei pidetä tieteenä ja vaatii paljon todentamista.
v12 murskaa v11:n täysin, joten tämä on tuloksista kiinni. luuletko sitten, että on olemassa selittämätöntä päästä päähän koska se on täysin murskattu, se on hyvin aivotonta, ja sinun pitäisi mennä alas?
yu zhenhua uskoo, että tekoäly on kokeellinen kohde niin kauan kuin tulokset vastaavat odotuksia, se osoittaa, että suunta on oikea ja sen pitäisi jatkua. hou xiaodi sanoi, että v12:n suorituskyky on huomattavasti edellä v11:tä vain siksi, että v11:n perusta on liian huono ja sen suorituskyky on vielä kaukana todellisesta kuljettajattomasta ajamisesta.
wang chensheng (entinen teslan hankintajohtaja):
jos se todella on täysin itseohjautuvaa ja sitä rajoittaa l5, sen on läpäistävä valvontaviranomaiset, ja niillä on oltava selitettävyys tai ennustettavuus.
lisäksi maailmassa on niin monia kaupunkeja, ja yhdysvalloissa jokaisella kaupungilla voi olla erilaisia lakeja ja määräyksiä. siitä, onko tämän auton mukauduttava paikallisiin lakeihin ja määräyksiin laitteiston ja ohjelmiston osalta, on tullut suuri kysymys, voidaanko sitä laajentaa.
end-to-end ei voi hienosäätää mallia keinotekoisesti määriteltyjen sääntöjen avulla, joten sen mukautumisesta erilaisiin säädöksiin on tullut haaste päästä päähän mittakaavassa.
toinen mittakaavaan vaikuttava tekijä on se, että päästä päähän on herkempi datamäärälle ja antureille.
5. tulevaisuus on epävarma
liu bingyan (kargo softwaren johtaja):
on olemassa erittäin vakava ongelma päästä päähän, mikä onse on herkempi anturille, eli kun muutat anturia tai anturin jakoa, mallisi voidaan kouluttaa kokonaan uudelleen.
toisesta näkökulmasta katsottuna sitä ei voida hyväksyä insinöörin näkökulmasta, tai emme voi kuvitella, että sama auto olisi tulevaisuudessa tien päällä kaikkialla maailmassa.
kun anturijakaumaa muutetaan, malli lakkaa ja harjoittelu on käynnistettävä uudelleen. koulutusta varten on kerättävä suuri määrä dataa, mikä tuo väistämättä valtavia kustannuksia.
amerikkalainen talousmedia cnbc kertoi, että vuoden 2023 alkuun mennessäfsd:n kouluttamiseen tesla käytti yli 10 miljoonaa teslan omistajien ajovideota.
lisäksi näitä yli 10 miljoonaa kappaletta koulutustietoja ei käytetä sattumanvaraisesti. niiden on oltava ihmiskuljettajia, joilla on suhteellisen korkea ajotaito. muuten mallin taso vain huononee.
siksi kokonaisvaltaisen mallin kouluttaminen ei vaadi vain paljon dataa, vaan vaatii myös monimutkaista seulontaa, joka kuluttaa paljon työvoimaa. se ei ehkä ole ongelma teslalle, joka myy paljon autoja, mutta muille yrityksille tietolähteistä on tullut suuri ongelma.
david ("big horses talking about technology" -elokuvan ankkuri):
monia oem-valmistajia on petetty, koska he ovat noudattaneet sokeasti teslan menetelmää, mutta tämä joukko asioita ei todellakaan sovi 90 prosentille oem-valmistajista.
tarkoittaako tämä, että muut valmistajat eivät todellakaan voi päästä päästä päähän -kenttään?
vaikka nvidia ja tesla molemmat ohjaavat päästä päähän -algoritmitoimintoja puhtaan näön kautta, päästä päähän voivat itse asiassa hyväksyä multimodaaliset syötteet.
tällä hetkellä yleisesti käytetyt anturit, kuten millimetriaaltotutka, lidar ja ultraäänitutka, ovat suhteellisen kiinteitä ajoneuvoon, erityisesti lidar, joka on periaatteessa katolla mallin kouluttamisessa käytetään erilaisia malleja, ja oem:lle jää enemmän suunnittelutilaa.
toisen keskustelukierroksen jälkeen jokaisella algoritmilla on omat hyvät puolensa, ja on edelleen epäselvää, mikä menetelmä voi johtaa meidät täysin ajurittomaan tulevaisuuteen.
zhang hang (risteilyn johtava tutkija):
en usko, että tällä hetkellä on olemassa mitään yksinkertaista ja laajamittaista algoritmia, joka sitten täyttää l4-standardin. tätä kenttää ei ole olemassa. olen hyvin optimistinen, että kaikki saavuttavat saman määränpään eri polkuja, vaikka jokaisella on hieman erilaisia poikkeamia.
6. mitään ei voida tehdä
riippumatta siitä, mitä algoritmia käytetään, se kohtaa lopulta pitkän hännän ongelman.
perinteisessä sääntöpohjaisessa (sääntöpohjaisessa) mallissa sääntöpohjan kirjoittaminen vaatii valtavan tiimin, joka käyttää paljon energiaa, ja on vaikea kattaa kaikkea päästä päähän ratkaistaan?
minfa wang (entinen waymon vanhempi koneoppimisinsinööri):
hän ratkaisi tavanomaiset tapaukset, mutta uskon, että pitkän hännän ongelma on edelleen olemassa.
minfa uskoo, että autonomisten ajojärjestelmien vikasietokyky on erittäin alhainen. jos l4:ssä aiotaan käyttää mustaa laatikkoa, on otettava käyttöön muita turvamekanismeja, mutta tämä palaa sääntöpohjaiseen tilaan.
itseohjautuvaa ajoalgoritmia harjoitellaan ensin simulaatiojärjestelmässä. voiko simulaatioharjoittelu ratkaista tiettyjä pitkän hännän ongelmia?
zhang hang (risteilyn johtava tutkija):
tällä hetkellä ei ole olemassa hyvää ratkaisua, joka todella auttaisi todellista tiesuoritustamme generoidun simulaatiodatan avulla.
minfa wang (entinen waymon vanhempi koneoppimisinsinööri):
autonomisen ajon tai robotiikan aloilla ympäristö on erittäin, hyvin monimutkainen oma auto muuttuu toisinaan vaikutat kaikkien autojen ja ympärilläsi olevien ihmisten käyttäytymiseen.
kuinka simuloida hyvin ja välttää jakelun muutos (jakelumuutos), se on mielestäni edelleen avoin aihe.
koska virtuaaliset kohtaukset eivät pysty täysin simuloimaan todellisuuden mahdollisuuksia, tarkoittaako tämä sitä, että alan pitkäjänteistä ongelmaa ei tällä hetkellä voida ratkaista ja se voi luottaa vain pitkäaikaiseen kokemusten kertymiseen?
anonyymi vastaaja (l4-insinööri):
tietyssä määrin kyllä, mutta sinun ei tarvitse olla täydellinen, eikö niin? ihmiset eivät ole täydellisiä, sinun on vain pystyttävä paremmin kuin muut. ihmisillä on myös omat tapaturmansa, kunhan pärjäät paremmin, se riittää.
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
mielestäni pitkähäntäkysymys on itse asiassa väärä ehdotus. olen iloinen, että otit sen esiin.
mielestäni kyseessä on pitkähäntäongelma. esimerkiksi, mitä minun pitäisi tehdä, jos näen krokotiilin? mitä minun pitäisi tehdä, jos näen norsun? näen kiinteäsiipisen lentokoneen pysäköitynä moottoritielle, mitä minun pitäisi tehdä?
itse asiassa, monien pitkän pyrstön ongelmat, me käärimme ne suureen ongelmaluokkaan. kuinka käsitellä esineitä, joita en ole koskaan nähnyt? se on melko hallittavissa, jos käärit sen yleisempään ongelmaan.
näimme kerran esimerkiksi kiinteäsiipisen lentokoneen pysäköimässä moottoritielle, joten ratkaisumme oli hyvin yksinkertainen, lopeta, eikö?
onko pitkähäntäongelma väärä ehdotus vai onko se ongelma, joka pitää ratkaista? jokaisella voi olla oma vastaus tähän aiheeseen. pitkähäntäongelma vastaa sitä, kun l4 tai jopa l5 voidaan ottaa käyttöön suuressa mittakaavassa, joten katsotaan seuraavaksi l2:n ja l4:n välistä kovaa konfliktia.
4. voiko tesla robotaxi menestyä: l2:n ja l4:n välinen konflikti
1. "ei voida tehdä"
kysyimme vierailta mielipiteitä ennen kuin musk ilmoitti robotaxin lykkäämisestä kaikilla oli tästä hyvin yksimielinen näkemys, eli teslan autonomisen taksin lanseeraus tänä vuonna on mahdotonta.
suurin syy siihen, miksi kaikilla on niin yhtenäinen näkemys, on se, että teslan nykyiset mallit eivät täytä itseajavien taksien l4-standardia.
liu bingyan (kargo softwaren johtaja):
olen hyvin varma, että olemassa olevissa tesla-malleissa on erittäin selkeät kuolleet kulmat. tämän kuolleen kulman ongelman ratkaisemiseksi palaamme siihen, mitä juuri sanoimme. sen täytyy säätää kamera-anturin asentoa. näiden asemien säätämisen välitön tulos on, että edellinen malli epäonnistuu.
visuaalisen kameraarkkitehtuurin näkökulmasta olemassa olevien autojen on mahdotonta saavuttaa fsd:tä, joka voi olla täysin ilman valvontaa. tästä näkökulmasta katsottuna siinä on oltava uusi laitteisto.
zhang hang (risteilyn johtava tutkija):
anturin näkökulmasta sen on tuotava käyttöön redundanssia, jota ei ehkä ole tarvittu l2:ssa aiemmin.
vaikka alan sisäpiiriläiset eivät ole optimistisia, mikä tekee muskista niin luottavaisen robotaxin lanseerauksessa?
yu zhenhua (entinen teslan tekoälyinsinööri):
luulen, että suurin syy on tämän fsd v12:n useat tekniset läpimurrot muskin hahmona, kun hän näki tänään fsd v12:n suunnitelmassaan, hän katsoi, että robotaxi pitäisi ottaa asialistalle.
joten, voiko fsd v12 mahdollistaa teslan siirtymisen l4:ään ja robotaxin tärkeän tehtävän? kuinka suuri ero on verrattuna nykyiseen waymoon tai cruiseen?
haastatellessamme hou xiaodia tästä kysymyksestä, hänen vastauksensa antoi meille mahdollisuuden nähdä alalla toinen näkökulma: toisin sanoen ero l2:n ja l4:n välillä on hyvin pitkä.
2. "ei edes lähellä"
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
ensinnäkin se, mitä tesla tekee, on ratkaisu, joka poistaa ihmisiä ja saa ohjelmistokehitysyritykset ottamaan vastuuta ajaminen, mikä ei ole kuljettajaa, joten se, mitä teet, ei ole sama asia.
tällä hetkellä l2-avusteista ajoa käyttävät laajalti autoyritykset, kuten tesla, xiaomi, huawei, xpeng jne., kun taas yritykset, kuten waymo, cruise, baidu ja muut itseohjautuvat taksit käyttävät l4:ää pitkälle automatisoitua ajoa, jättäen kirjallisen sivuun. käsitteen määritelmät,olennainen ero näiden kahden välillä on se, kuka kantaa vastuun.
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
ratkaisua, joka poistaa ihmisiä ja siirtää vastuun ohjelmistokehitysyrityksille, kutsutaan itseohjaukseksi. kerron vitsin, mitä jos tesla tappaa jonkun? elon muskille se ei ole heidän asiansa.
siksi, jos tesla haluaa tehdä itseohjautuvia takseja, sen on kannettava oma vastuunsa. mitkä ovat tekniset erot avustetun ja autonomisen ajon välillä?
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
mikä on l4 autonomisen ajamisen ydinongelma? se on turvallisuutta, se on redundanssia, kun järjestelmän jokainen moduuli saattaa epäonnistua, järjestelmä voi silti varmistaa lopputuloksen turvallisuuden. tämä on l4:n vaikein ja kriittisin osa. sen on ratkaistava turvallisuusongelma ennen rahan ansaitsemista, mutta tämä asia ei ole ollenkaan teslan suunnittelun tarkoitus.
toinen l4 autonomisen ajon tutkija analysoi myös l2:n ja l4:n eroja laitteiston ja ohjelmiston näkökulmasta.
zhang hang (risteilyn johtava tutkija):
l4-ratkaisu on ensinnäkin se, että meillä on suhteellisen tehokkaat anturit, joita voi olla vaikea käyttää l2-skenaarioissa, ainakaan ei niin korkean tarkkuuden lidaria.
algoritmisen näkökulmasta l2 voi olla enemmän keskittynyt olemaan tehokkaampi ja alentamaan kustannuksia erittäin alhaisina. se ei vaadi erityisen kalliita antureita ja saattaa vaatia vähemmän laskentaa tällaisen vaikutuksen saavuttamiseksi. näiden l2:iden ei itse asiassa tarvitse ottaa huomioon tätä yksi miljoonasta tapausta.
sitten me l4:ssä pyrimme siihen, että ihmisten etäapu on otettava käyttöön vain kerran miljoonasta mailista tai useammin.
yhteenvetona:l4-ratkaisussa käytetään tarkempia antureita, sirulla on enemmän laskentatehoa ja se pystyy käsittelemään kattavampia skenaarioita.
l2-ratkaisussa kuitenkin ensisijaisesti huomioidaan kustannukset, joten laitteistotaso tulee olemaan hieman alhaisempi. samaan aikaan alemman tason laitteistoon sopeutumiseksi algoritmi kiinnittää enemmän huomiota tehokkuuteen kuin turvallisuuteen, joten. l2:n haltuunottotaajuus on paljon suurempi kuin l4:n.
joten voivatko l2-yritykset, kuten tesla, saavuttaa l4-tehosteita parantamalla laitteistoa ja ohjelmistoja?
3. "kaksi eri asiaa"
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
en kannata l2:n hidasta kehitystä l4:ksi ja l5:ksi. mielestäni tämä asia on toinen väärä ehdotus, jolla on vahvat ekstrapolointiominaisuudet.
voivatko delfiinit kehittyä ajan myötä sivilisaatioksi? mielestäni se on mahdollista, mutta meidän on tiedettävä, että maapallon sivilisaatio ei enää siedä delfiinien evoluutiota, koska on jo yrityksiä, jotka ovat onnistuneet toteuttamaan l4:n mahdollisimman nopeasti. minulla ei ole mitään tekemistä kanssasi, kun olen laskeutunut maahan, eikö niin? kun homo sapiens otti keihään, ei ollut delfiinejä luomassa sivilisaatiota.
hou xiaodin mielestänykyiset l4-yritykset ovat jo rakentaneet teknisiä esteitä kovassa kilpailussa, ne eivät anna l2:lle mahdollisuutta kehittyä.samaan aikaan jotkut ihmiset uskovat, että tämä ei tarkoita sitä, että l4-tekniikka on edistyneempi kuin l2, vaan että jokainen kohdistaa eri skenaarioihin.
yu zhenhua (entinen teslan tekoälyinsinööri):
jos sanomme, että l4 on todella teknisesti niin edistynyt ja l2:ta edellä kuin kaikki kuvittelevat. haluaisin siis kysyä, miksi l4-tekniikkaa ei voida suoraan alentaa l2:ksi?
itse asiassa viime vuosien aikana l4-yritykset ovat tulopaineen vuoksi auttaneet autonvalmistajia tekemään l2-luokan autoja, mutta ne eivät voi yksinkertaisesti alentaa luokitusta, vaan niiden on periaatteessa kehitettävä uudelleen.
tiedämme myös, että yhdysvalloissa gm (general motors) omistaa cruise l4 -yhtiön ja ford omistaa argo ai:n, joka on myös l4-yhtiö. miksi gm ei voi käyttää cruisen teknologiaa massatuotetuissa ajoneuvoissaan? miksi ford ei voi käyttää argo ai:n l4-teknologiaa tuotantoajoneuvoissaan? joten l4 ei ole ehdottoman edistyneempi kuin l2 mitä tulee teknisiin vaikeuksiin, en usko, että jos teet l4:n, näytät olevan kovin edistynyt.
miksi l4-tekniikkaa ei voida suoraan alentaa l2-tekniikkaa käyttöä varten? zhang hang selitti, että koska l4 käyttää korkeampia laitteistospesifikaatioita ja l2:n algoritmin on mukauduttava antureisiin, joiden tekniset tiedot ovat alhaisemmat ja prosessoreihin, joilla on pienempi laskentateho, näiden kahden teknologiaa ei voida siirtää suoraan.
aivan kuten arkkitehtisuunnittelija, jolta takavarikoitiin tietokone ja jolle annettiin vain viivain ja kynä ja paperi huonolla tarkkuudella, hänenkin oli sopeuduttava uuteen piirustustapaan.
zhang hang (risteilyn johtava tutkija):
se, mitä mainitsit aiemmin, on l2-ratkaisun tukeminen. laitamme supertietokoneen auton takakonttiin.
samaan aikaan zhang hang osoitti myös avoimempaa mieltä verrattaessa l2:n ja l4:n teknologioita, ja sillä on laajempi kattavuus ja sen on kohdattava enemmän skenaarioita, ja vain perusongelmat on ratkaistava. l4:n kattavuus on rajallinen, mutta se kiinnittää enemmän huomiota erilaisiin yksityiskohtiin. joten näiden kahden välillä on hyvät ja huonot puolet.
zhang hang (risteilyn johtava tutkija):
itse l4:ää ei voida käyttää l2-ratkaisuna yksinkertaisesti yksinkertaistamalla olemassa olevaa järjestelmää ja poistamalla redundanssia, vaan päinvastoin. jos haluat saavuttaa l4-standardin, sen hiominen kestää kauan. tarvitset pitkän ajan tietojen keräämiseen ja kokemuksen keräämiseen.
mutta en usko, että meidän tekninen reitti tai tekninen syvyys olisi korkeampi kuin l2. en usko, että näin on, sillä l4:llä voi olla monia algoritmeja, jotka eivät ole kovin huippuluokan, mutta ne voidaan ratkaista huolellista suunnittelua nämä ovat joitain hyvin yksityiskohtaisia pitkän pyrstön kysymyksiä.
kumpaa näkemystä kannattaisit? voit jättää meille viestin. haastatteluissamme eri ihmisillä on omat vastauksensa tähän kysymykseen.
yu zhenhua (entinen tesla l2 -insinööri):
luulen, että suuri yleisö ja jopa jotkut l4-yritykset juurruttavat jokaiseen käsitteen, eli l4-tekniikka on parempi kuin l3 ja sitten parempi kuin l2. mielestäni tämä on skenaario, joka eroaa rajoituksistaan ja johtaa yleisöä harhaan, koska l4:n nykyisellä robotacilla on hyvin rajoitetut skenaariot ja sen on oltava esimerkiksi tietyllä alueella.
shao xuhui (foothill venturesin johtava kumppanisijoittaja):
olen henkilökohtaisesti edelleen optimistinen l4-yritysten suhteen, koska tämän logiikan perusteella l4 voi vähentää ulottuvuuksia ja hyökätä, mutta jos teet vain tämän, sinua ei ylennä l2-yritykseen tai se on erittäin, erittäin vaikeaa ylennyksenä.
anonyymi vastaaja (l4-insinööri):
itse asiassa en usko, että teknologiapinossa on erityisen vaikeaa kynnystä. esimerkiksi jos yritys voi väittää olevansa l2-yritys, se ehkä lisää huomenna uusia teknologioita ja pystyy myös tekemään l4:n. ? kaikki riippuu siitä, mitä tekniikkaa se käyttää sovelluksessaan tai mitä uusia teknologisia läpimurtoja sillä on, eikö niin?
hou xiaodi (tusimplen entinen perustaja ja toimitusjohtaja, bot.auton perustaja):
avustettu ajo ja kuljettajaton ajo ovat kaksi eri asiaa.
tuottajat: hong jun, chen qian, kirjoittaja: wang ziqin, toimittaja: chen qian