uutiset

90-luvun jälkeinen Pekingin yliopiston ohjaaja rakentaa humanoidirobottia, ei opi Teslasta

2024-08-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Yhdysvallat ei ole malli Kiinalle.

Teksti 丨 Wang Yutong
Toimittaja丨Cheng Manqi

Tämän vuoden toukokuussa Texasin tehtaalla Yhdysvaltoihin tuli töihin uusi 1,72 metrin pituinen työntekijäryhmä. He vastasivat sylinterimäisten 4680 akkukennojen lataamisesta siirtopöydästä edessään olevaan punaiseen laatikkoon. . He eivät ole kovin taitavia, he ovat jopa hitaita ja kömpelöitä. Mutta nämä työntekijät ovat Optimuksia, humanoidirobotti Tesla julkaistaan ​​vuonna 2022, ja kaikki on toisin.

"Täydelliset käyttöskenaariot", "nopea kehitys" ja "työttömyysvaroitus" Teslan julkaiseman robottivideon alla ihmisten kommentit vaihtelivat huudosta huoleen.

Wang Hän ei usko, että Optimus on "vielä tutkimus (tutkimus)" tässä vaiheessa.

Wang He, syntynyt vuonna 1992, on tällä hetkellä apulaisprofessori ja tohtorin ohjaaja Pekingin yliopiston Frontier Computing Research Centerissä on osallistunut tietokonenäköä, robotiikkaa ja tekoälyä käsittelevään huippukonferenssiin CVPR ICCV Odota kymmenien julkaisujen julkaisemista.

Viime vuoden toukokuun jälkeen Wang He herätti enemmän huomiota älykkään robottiyrityksen "Galaxy General" ruorimiehenä. Tämän vuoden kesäkuussa Galaxy General rikkoi vuoden 2024 enkelikierroksen rahoitusennätyksen 700 miljoonan yuanin rahoituksella.

Useimmat yritykset valmistavat täydellisiä humanoidirobotteja. Wang He uskoo, että jalat eivät ole optimaalinen ratkaisu tässä vaiheessa ja vain lisäävät kustannuksia. "Kyse ei ole siitä, että humanoidirobotin toimintakyky olisi riittävän vahva, mutta siitä puuttuvat jalat. Se, että on vielä paljon tehtäviä, joita perinteiset robottikädet eivät pysty suorittamaan Wang Hän arvioi, että hänen kätensä ovat arvokkaampia laskeutuessaan paikalle." ja suuri määrä kohtauksia ei itse asiassa vaadi niitä.

Galaxy Universalin Galbot kerää roskia. Siinä ei ole jalkoja, vaan kokoontaitettava yksijalkainen runko.

Riittävän tiedon saaminen on vaikeaa ruumiillistuneen älykkyyden kehittämisessä. Tesla ja Google ovat valinneet "teleoperaation" tiedon keräämiseen, toisin sanoen antamalla oikeiden ihmisten käyttää keräysvälineitä suorittaakseen robotin tarvitsemat toiminnot. Wang Hänen mielestään tämä ei ollut hyvä sopimus: "Googlelta kesti yli kymmenen kuukautta ja kymmeniä miljoonia dollareita tuottaa satoja tuhansia datakappaleita. Galaxy Universal valitsi kaikki "Sim2Realissa (simulaatiosta oikeaan koneeseen". )" eli pääasiassa synteettisiin simulaatiotietoihin luottaen.

Yhdysvaltalaisilla humanoidirobottiyrityksillä on paljon rahaa ja ne ovat rohkeita. Yksi Wang Hein havainnoista on se, että tämä estää niitä etsimästä tiukasti PMF:ää (Product Market Fit, product and market fit). on rahaa, he vain yhdistävät kaiken kerralla. Toimialan ongelmat, kuten todellisen datan puute ja epävakaa laitteisto, on kuitenkin ratkaistava skenaarioissa, joten kaupallistamista on hänen mielestään harkittava heti ensimmäisestä päivästä lähtien.

"Meidän ei pitäisi pitää Teslan toimintaa standardina, Wang Hän sanoi, että "jos he edelleen kertovat muiden ihmisten tarinoita ilman runsaasti pääomaa Yhdysvalloissa, se voi olla vain umpikuja."

Wang Hän ei ole samaa mieltä Teslan kanssa, ja monet alan ihmiset eivät ole samaa mieltä Galaxy GM:n kanssa. Esimerkkinä Sim2Real, josta Wang Hän on kiinnostunut, monet harjoittajat uskovat, että simuloidun synteettisen datan ja todellisen maailman välillä on luonnollisia eroja, jotka vaikuttavat harjoitusvaikutukseen. Galaxy Universalin ensimmäisen robotin Gabotin julkaisun jälkeen jotkut vastustajat sanoivat olevansa "helpottuneita": "Demon ja sovelluksen välillä on suuri kuilu", "Kirjoitin paljon papereita tarttumisesta, ja viimeinen käsi oli imu. kuppi".

Isompi kysymys on, että nyt ei ole aika aloittaa yritystä, joka valmistaa humanoidirobotteja. Jotkut sijoittajat uskovat, että näistä yrityksistä tulee marttyyreja, koska monet tekniikat, kuten laitteistot, materiaalit ja energia, eivät ole vielä kypsiä. Kaifu Lee puhui ruumiillisesta älykkyydestä ja sanoi: "Emme todellakaan voi investoida nyt johonkin, joka tapahtuu 10 vuotta myöhemmin, Dai Yusen, Zhengen kumppani, sanoi, että ruumiillistuma on edelleen BlackBerryn aikakaudella, eikä se voi sijoittaa iPhoneen." .

Humanoidirobotit ja ruumiillinen älykkyys ovat vielä hyvin varhaisessa vaiheessa, ja tämä on ala, jolla on pitkä ketju ja monimutkainen teknologiapino, mukaan lukien tekoäly, materiaalit, energia, mekaaninen ohjaus, valmistus, toimitusketjun hallinta, asiakaskehitys ja viime kädessä selviytyvä yritys Ei voi olla puutteita.

On liian aikaista kertoa voittajasta, mutta tämä haastattelu tallentaa sen, mitä eräs nuori tiedemies näki vuosi matkan jälkeen. Hän uskoo nyt, että vaikka suurilla yrityksillä on enemmän resursseja, ne eivät välttämättä ole oikein.

Ruumiillinen älykkyys ja ihmisyhteiskuntasuurin yhteinen jakaja

"Myöhemmin": Olet opiskellut tämän päivän ruumiillistuneisuutta vuodesta 2016 lähtien – yhdistäen visuaalisia malleja, luonnollisen kielen malleja ja robotin toimintamalleja. Mitä olet nähnyt näiden vuosien tutkimus- ja kehitystyöstä?

Wang He: Työskentelin ruumiillistuneen älykkyyden parissa, kun opiskelin tohtoriksi. Sitä ei tuolloin kutsuttu "ruumiilliseksi älyksi". objekti Asennon ja asento kolmiulotteisessa avaruudessa sijainnin estimointi: esineen asennon löytäminen) on itse asiassa bimanuaalinen toimenpide.

Palattuani Kiinaan ja ennen perustamista tänne asensin käsivarren Yushu-robottikoiran selkään ja yritin saada sen suorittamaan sarjan operaatioita. Huomasimme kuitenkin, että monet tietojenkäsittelyn, resurssien ja jopa koko järjestelmän näkökohdat eivät vastanneet tarpeitamme.

Tuolloin minusta tuntui, että jos emme tekisi laitteistoa, joutuisimme luottamaan täysin muihin ja järjestelmän kehitysiteraatiot olisivat rajallisia. Kun robottiteollisuutta ei ole olemassa, on vaikea tehdä vain älykkyyttä.

"Myöhemmin": Mitä muutoksia tapahtui myöhemmin? Miksi päätit perustaa yrityksen vuonna 2023?

Wang He: Embodied smart yrittäjyys alkoi käydä Kiinassa aikaisemmin kuin Yhdysvalloissa. Pääsyynä on laitteiston ja ontologian kypsyys.

Yhdysvaltojen valmistusteollisuus ei mahdollista ruumiillistuneen älyn täydellisten demojen nopeaa tuotantoa. Yhdysvalloissa osien tarjonta on puutteellista, monet asiat on tuotava maahan, ja laitteistoinsinööreistä on pulaa. Kiinan laitteistotuotannossa voidaan saavuttaa alhaisimmat kustannukset ja suurin luotettavuus. Esimerkiksi Yushun humanoidirobotin pystyy rakentamaan muutama ihminen puolessa vuodessa.

Mutta ontologia on vain suuri lelu. Seuraava askel on kilpailla älykkyyden suhteen. Vuoteen 2023 mennessä suuria ruumiillistuneita multimodaalimalleja, kuten PaLM-E, on ilmestynyt ympäri maailmaa, ja kipinä multimodaalisen havainnon ja ruumiillistuneen toiminnan välillä on syttynyt. Päätin aloittaa yrityksen tässä vaiheessa.

"Myöhemmin": Miksi päätit perustaa humanoidirobotin? Ruumiillistuneen älyn kantaja ei välttämättä ole humanoidi.

Wang He: On todellakin erilaisia ​​muotoja, mukaan lukien koirat, lentokoneet ja autot. Mutta kaikkien muotojen joukossa suurin yhteinen nimittäjä ruumiillistuneen älyn ja ihmisyhteiskunnan välillä voi olla vain "ihmismuoto".

Koska koko tuotanto- ja elinympäristö on suunniteltu ihmisille, humanoidi pystyy tekemään eniten operaatioita, sitä on tulevaisuudessa eniten ja sillä on suurin taloudellinen tuotosarvo. Vision näkökulmasta ruumiillistunut älykkyys ja humanoidirobotit voidaan rinnastaa toisiinsa.

"Myöhäinen": Monet ihmiset uskovat, että ruumiillistuneen älykkyyden yrittäjyysikkuna ei ole vielä saapunut. Nyt näistä yrityksistä tulee marttyyreja, ja monet tekniikat, kuten laitteistot, materiaalit ja energia, eivät ole vielä kypsiä. Esimerkiksi, kun Kai-fu Lee puhui ruumiillisesta älykkyydestä, hän sanoi: "Emme todellakaan voi investoida sellaiseen, mikä tapahtuu 10 vuotta myöhemmin, Dai Yusen, Zhengen kumppani, sanoi, että ruumiillistuma on edelleen BlackBerryn aikakaudella." eikä voi sijoittaa iPhoneen.

Wang He: Kun tapasin herra Kaifu Lin vuonna 2019, hän sanoi, että siihen menee vielä 50 vuotta. Nyt hän on kiihtynyt 50 vuodesta 10 vuoteen.

Emme voi käyttää matkapuhelimia analogiana ruumiillistuneelle älykkyydelle Toimivista puhelimista älypuhelimiin teknologia on muuttunut paljon, ja nyt ruumiillistuneen älyn tekninen suunta on ollut selvä: ontologia on integroitu suureen malliin, josta tulee universaali robotti. .

Tällä hetkellä mitä aikaisemmin peli päättyy, sitä enemmän teknologiaa ja dataa kertyy, mikä kasvattaa kuilua myöhemmässä vaiheessa. Kun robotti tulee paikalle, todellisen kohtauksen tiedot täydentävät sen älykkyyttä. Myöhäisten tulokkaiden on äärimmäisen vaikeaa ohittaa yritys, jolla on jo kymmeniätuhansia robotteja, joka virtaa jatkuvasti todellista dataa takaisin ja joka on jo kokenut näyttämöllä sudenkuoppia.

Tämä jaAutonominen ajoVastaavasti vain myymällä riittävä määrä autoja saadaan riittävästi dataa ja dataa voidaan käyttää algoritmin parantamiseen nopeammin. Googlen ja Teslan välisessä taistelussa Tesla voittaa, koska sillä on tarpeeksi autoja.

Kehittyneellä älykkyydellä on potentiaalia kasvaa autoihin verrattavissa oleviksi markkinoiksi. Sillä on samat ominaisuudet kuin aikaisemmilla teknologisilla muutoksilla: se on aluksi hidas ja korvaa vähitellen erikoisrobotteja, mutta kun se saavuttaa 10 000 yksikön mittakaavan, se nopeuttaa perinteisten teollisuudenalojen korvaamista.

"Myöhäinen": Yksi tosiasia on, että ruumiillistuneen älykkyyden yrittäjyyden puomi tapahtui vuonna ChatGPT ja suuri mallihulluus. Mutta itse asiassa suuret mallit voivat ratkaista vain pienen osan ruumiillistuneen älykkyyden ongelmista, joten joidenkin mielestä se on liian aikaista.

Wang He: Kehollinen älykkyys on ohjelmistojen, laitteistojen ja algoritmien yhdistämisen tuote. Tässä vaiheessa sen integraatiopisteitä suuriin malleihin ovat: yleinen havainto ja vuorovaikutusongelmia ratkaiseva kielikommunikaatio. Esimerkiksi joku tulee apteekkiin ja kysyy robotilta, mitä lääkettä pitäisi ottaa, kun tuntuu epämukavalta? Vain robotit, jotka tuntevat lääkkeiden nimet ja sijainnit, voivat puhua ihmisille.

Toinen yhdistelmä on, että nyt suoritettaessa tiettyjä toimintoja, kuten esineiden tarttumista ja asettamista, robotti on toteuttanut myös päästä päähän suuren mallin perusteella (robotin liikerata tulostuu suoraan aistitietojen syöttämisen jälkeen). iso malli tulee olemaan mukana koko globaalissa suunnittelussa.

Kaiken kaikkiaan suuret mallit ovat nyt apulaitteita, mutta suurten ja pienten mallien yhdistelmä voi johtaa universaaleihin robotteihin.

"Late": Galaxyn reitti on pieni kolmiulotteinen visuaalinen malli + suuri perusmalli.

Wang He: Aivan kuten meillä ihmisillä on System 1 ja System 2, nopea ajattelu ja hidas ajattelu, ensimmäinen on pikkuaivojen kyky, ja roboteissa se on taitoja, kuten interaktiivinen ohjaus ja näppärä käyttö, jotka voidaan käsitellä pienillä malleilla. jälkimmäinen on Aivojen kykyjä ovat kognitio, ymmärtäminen, suunnittelu ja ongelmien ratkaiseminen suurilla malleilla.

Tämä on kolmikerroksinen järjestelmä: alin kerros on laitteistoa, keskikerros pieniä malleja, jotka voivat suorittaa erilaisia ​​taitoja, ja ylempi kerros on suuri perusmalli, joka vastaa tehtävien suunnittelusta. Kun robotti on saanut ohjeen, iso malli vastaa keskikerroksen pienen mallin kutsumisesta. Kun pieni malli on suoritettu, iso malli tutkii seuraavaa vaihetta tulosten perusteella.

Jalat eivät ole niin tärkeitä;Kädet ovat avain

"Myöhemmin": Ne ovat kaikki humanoideja. Useimmilla alan yrityksillä on robotteja, joissa on jalat.

Wang He: Olennaisin kysymys on, mitä arvoa tuotteesi voi tuoda näyttämölle? Kaksijalkaiset ratkovat vain liikenneongelman, eivätkä he pysty toimimaan, joten he voivat tehdä vain partioita, tarkastuksia ja muita tilanteita. Tämä ei ole laadullinen muutos aikaisempaan autojen ja koirien käyttöön.

Mutta kädet voivat tehdä joustavaa tuotantoa, jota perinteiset robotit eivät pysty tekemään. Ne ovat enimmäkseen rankkoja töitä työvaltaisilla aloilla ja niitä on helpompi yleistää. On monia mielikuvituksellisia tiloja ja skenaarioita, joten ylävartalo on tärkeämpi kuin alavartalo.

"Myöhään myöhemmin": kumpi on vaikeampaa, kyky käyttää käsiä vai kyky suorittaa monimutkaisia ​​jalkojen liikkeitä? Lopullinen muoto, jonka jokainen kuvittelee, on täydellinen ihmismuoto. Pystyykö ensimmäisenä aloittava yritys pysymään perässä, kun se haluaa täydentää urheilukykyään?

Wang He: Nykyään useimmat toiminnot suoritetaan molemmilla käsillä, joten käytämme ensin "käsiä" päästäksemme paikalle ja käytämme vaihdettavia, edullisia yleiskäyttöisiä pyörillä varustettuja runkoja. Ensin kaupallistamme ja hankimme todellisia tietoja.

Kaksijalkaisten tuotteiden ongelmana on, että niitä ei voida toteuttaa todellisissa skenaarioissa, joten kaksijalkaisia ​​tuotteita tekevien yritysten on pyrittävä kestävään rahoituskykyyn, ja seuraavan kolmen vuoden aikana tulee isoja aaltoja. Tietysti jalkojen suorituskyvyn parantuessa ja hinnasta tulee oikea, vaihdamme myös jalat.

"Myöhemmin": Miksi se ei ole vaihtoehto tehdä sitä yhdessä?

Wang He: Koska humanoidirobotin toimintakyvyt eivät ole tarpeeksi vahvoja, mutta sen jalat puuttuvat. On edelleen paljon töitä, joita perinteiset robottikädet eivät kestä.

Todelliseen käyttöön nähden pyörillä varustettujen robottien hinta ja vakaus ovat paljon parempia kuin kaksijalkaisten robottien. Samalla korkeudella kahden jalan BOM (raaka-ainekustannus) on kymmenen kertaa kalliimpi kuin pyörillä varustettu alusta. Lisäksi jalat ovat helppoja pudota, ja jos robotti putoaa, se vaurioituu täysin.

Jalkojen nykyiset tekniset vaikeudet on vielä voitettava, ja ne ovat paljon kahden käden taustalla. Jos esimerkiksi jotain putoaa hyllyltä lattialle, yksikään jalkainen humanoidirobotti maailmassa ei voi kumartua noutamaan sitä.

"Myöhemmin": Kyykky on melko helppoa ihmisille, miksi robotit eivät pystyisi siihen?

Wang He: Vaikeinta on säilyttää kehon tasapaino koko prosessin ajan. Jalkojen tasapainokyvyssä on useita vaiheita: ensimmäinen askel on kävellä ja toinen askel portailla kiipeäminen. Tämä on jo järkyttänyt useita yrityksiä. Kolmas vaihe on kumartuminen. Vaikeus on siinä, että painopiste tulee ulos.

Jalkojen kehitys on jäljessä käsien kehityksestä, ja sama pätee ihmisiin, kun vauvat voivat vain ryömiä, heidän kätensä voivat tutkia kaikkialla, mutta seisomaan ja kävelemään kestää kauan kuusi tai seitsemän vuotta vanha.

Itse asiassa 20 vuotta sitten oli demoja kaksijalkaisesta kävelystä. Nykyään on vain kourallinen ihmisiä, jotka voivat kävellä maassa kymmenen minuuttia ilman ongelmia. Monien kaksijalkaisten robottien vakaus ei yksinkertaisesti täytä kaikkien odotuksia. Kehittyneen älykkyyden alalla aivojen kehitys on käsivarsien ja käsien edellä ja kädet ja kädet jalkoja edellä.

"Myöhäinen": Teslan humanoidirobotti Optimus on sekä kädet että jalat, ja voi nyt työskennellä tehtaissa.

Wang He: Optimuksen nykyisellä työelämällä ei ole mitään tekemistä jalkojen kanssa.

Ja sitä on vaikea laskea: robotin hinta on satojatuhansia - kaksisataatuhatta dollaria, mutta sen tehtävänä on laittaa täsmälleen samat akut viisi kertaa kuusi laatikkoon, jossa on yhteensä kolmekymmentä ristikkoa, eli laita vakioakut standardiin Korissa korin asento on kiinteä. Miksi jokin tällainen vaatisi ruumiillistuvaa älykkyyttä? Miksei käytä perinteistäTeollisuusautomaatio

"Myöhään": Galaxy General Galbot lajittelee lääkkeitä Meituanin apteekeissa. Tämän voi tehdä myös robottikäsivarrella, mutta käytit myös humanoidia.

Wang He: Loimme tämän kohtauksen osoittaaksemme ruumiillistuneita kykyjämme. Jos jokin on liian vaikeaa eikä tekniikka ole vielä kehittynyt tähän vaiheeseen, meidän pitäisi ensin etsiä jotain, mitä voidaan tehdä. Teslan kohtaus toteutettiin alun perin robottikäsivarrella, joka ei edes korvannut ihmisiä. Apteekissa tehtävän työn tekee ihminen, ja vaikeus itsessään on korkeampi kuin Teslassa. Toiseksi sitä ei voida saavuttaa pelkällä teollisuusautomaatiolla, koska eri lääkkeet eivät ole vakiotuotteita, eivätkä eri tilaukset ole vakiovaatimuksia.

Älä pidä Teslaa mallina,Etäkäyttö ei voi ratkaista tietoongelmia

"Myöhäinen": Tiedon puute on yksi ruumiillistuneen älyn vaikeuksista nykyään: tekstidataa on nyt 15T, kuvat 6B ja videot 2,6B, mutta robottidataa on vain 2,4M. Sekä Tesla että Google keräävät dataa "teleoperaation" kautta, toisin sanoen antamalla oikeiden ihmisten käyttää keräysvälineitä suorittaakseen robotin tarvitsemat toiminnot, kun taas Galaxy General käyttää "kaikkia Sim2Realissa", eli simuloitua synteettistä dataa. Miksi olet erilainen kuin he?

Wang He: Kaukosäätimellä ei ole startup-yrityksillä varaa. Etäkäyttö edellyttää useiden ihmisten palkkaamista suorittamaan erilaisia ​​toimintoja toistuvasti. Saadakseen pätevän datan robotin ja henkilön on viettävä yhdessä 30 sekuntia tai minuutti.

Tässä humanoidirobotit eroavat suuresti autonomisesta ajamisesta. Teslan autonomisen ajon ansiosta miljoona auton omistajaa voi käyttää rahaa auton ostamiseen ja ajamiseen satoja miljoonia tunteja ilman, että heidän tarvitsee käyttää ylimääräistä rahaa dataan. Ja ajaminen on vain yksi asia, mutta tehtaalla on monenlaisia ​​töitä - liimaajia, akkujen laittajia, ruuveja kiristäviä... Eri tehtävien välinen korrelaatio voi olla vahva tai heikko.

Tesla löysi kymmeniä ihmisiä suorittamaan etätoimintoja akkujen sijoittelupaikalta, mutta sitten oli enemmän operaatiokohtauksia, kuten käämitys ja kokoonpano, eikä siinä vielä kaikki. Teslalla on paljon rahaa ja oma tehdas omien robottien ostamiseen. Se voi tehdä tämän, mutta startupit eivät.

Aivan kuten kuljettamattomissa autoissa on nyt etämonitorit, myös teleoperaatiolla voi olla etävalvontaa. Jos jokin menee pieleen robotin työskennellessä tapahtumapaikalla, eikä paikalla ole ketään, voidaan puuttua kaukosäätimellä.

"Myöhemmin": Onko kaukosäädin siis suuren yrityksen valmistama peli?

Wang He: Tämä on tarina, jonka Musk kertoo. Älkäämme pitäkö Teslan tekemistä standardina. Ollakseni rehellinen, tämä on tutkimusta.

Kun Google työskenteli RT:n (robotin muuntaja, robottiohjausalgoritmi) parissa, siellä oli yli 200 hengen "Every Day Robots" -tiimi. RT-1:n valmistumisen jälkeen tämä osasto lakkautettiin, koska liiketoimintamallia ei ollut olemassa.

Tällä hetkellä Kiinan ruumiillistuneiden tiedusteluyritysten joukossa vain ne, joilla ei ole omia reittejä, voivat jäljitellä Teslaa ja Googlea Yhdysvalloissa. Jos amerikkalainen yritys ei ole hyvin pääomitettu ja silti kertoo muiden ihmisten tarinoita, se on umpikuja.

"Myöhemmin": Riippuuko tämä myös yleisrobotin tekemiseen tarvittavasta datamäärästä, jos se on suuruusluokkaa pienempi, erityisen varakas suuryritys tai startup, joka voi kerätä rahaa, voi myös pystyä käyttämään kaukosäädintä? toimintareitti?

Wang He: Omissa kokeissamme on havaittu, että esimerkiksi indeksointitehtävässä, kun dataa on miljardi indeksointia, robotin onnistumisprosentti voi nousta 87 prosenttiin , eli 100 000 Kun indeksoitiin ensimmäistä kertaa, onnistumisprosentti oli vain 58 %. Tämä osoittaa, että ruumiillisella älykkyydellä on myös selkeät skaalauslait ja se janoaa enemmän dataa.

Todellisessa maailmassa on vaikea saada miljardeja tietoja. Googlelta kesti yli kymmenen kuukautta ja kymmeniä miljoonia dollareita kerätä satoja tuhansia tietoja.

"Myöhäinen": Kuinka paljon simulointi voi vähentää kustannuksia?

Wang He: Simulaatiosynteesin avulla kaikki kuusikymmentä kuvaa voidaan renderoida yhdessä sekunnissa. Reaalimaailman tietojen keräämiseen verrattuna synteettinen data on lähes ilmaista. Toinen käyrämme on saada tietoja todellisesta maailmasta.

Simulaattorissa syntetisoimme kunkin kohteen liikkeen 200 videoksi ja sitten simuloimme ja syntetisoimme yksittäisen objektin objektiluokiksi. Tämä tuottaa suuren määrän dataa, jota käytämme robotin tarttumiskyvyn harjoittamiseen.

"Myöhäinen": Monet ihmiset uskovat, että emulaattorilla (järjestelmä, joka tarjoaa simuloidun virtuaaliympäristön) saatu synteettinen data eroaa luonnollisesti todellisesta datasta, mikä vaikuttaa harjoitusvaikutukseen. Miten ratkaiset sen?

Wang He: Simulaattori ei voi koskaan olla täysin todellinen, mutta Sim2Real-reitti ei vaadi simulaattorin täydellistä simulointia. Se on laitteiston, algoritmien ja simulaation yhteinen optimointiprosessi.

Tässä vaiheessa simulaattori on varmennustyökalu, ja algoritmissa ilmaistu matemaattinen fyysinen malli on indeksointipätevyyden saamisen ydin.

Simulaattorilla on joitain rajoituksia. Esimerkiksi kun kätemme koskettavat kivennäisvesipulloa, eli kun taipuisa, muotoaan muuttava käsi koskettaa näennäisesti jäykkää esinettä, joka voi itse asiassa muuttaa muotoaan, tämä prosessi ei ole pistekosketus, mutta ei mitään fyysisesti täydellisesti mallinnettu.

Tällä hetkellä algoritmillamme on oltava vahvat mukautumisominaisuudet, kuten kosketuksen ja voiman ohjauksen lisääminen, "muodon" oppiminen ja sen hallinta sen jälkeen, kun siihen on tartuttu. Näin voimme välttää simulaation vaikeimman osan. Toinen lähtökohta on se, että laitteiston tulee olla riittävän vankka (Robust eli järjestelmä voi toimia suhteellisen vakaasti myös epänormaaleissa olosuhteissa).

"Late": Miten simulaattorit ja algoritmit, kuten matemaattiset ja fyysiset mallit, toimivat yhteistyössä?

Wang He: Ehdotamme joukkoa matemaattisia ja fyysisiä malleja tehokkaiden hakujen kaappaamiseksi ja käytämme sitten simulaattoria varmistaaksemme, onko tällainen sieppaus mahdollista.

Tässä käsitellään myös vahvistusoppimisen ja ohjatun oppimisen eroa. Jos se on vahvistusoppimista, se tarkoittaa vuorovaikutusta simulaattorin kanssa useaan kertaan, kokeiluja ja ratkaisun löytämistä. Jalkakävely edellyttää täysin Sim2Real-simulaattorin aitoutta. Mutta tämä on kokeiltu ja tehokkuus on suhteellisen alhainen.

Jos osaat kertoa robotille, kuinka tarttua, se voidaan muuntaa ohjatuksi oppimiseksi ja oppimistehokkuus on korkeampi. Käytämme ohjattua oppimista kahden ja viiden sormen tarttumiseen.

Harkitse sitä ensimmäisestä päivästä lähtienkaupallistaminen

"Myöhemmin": Useimmat kiinalaiset humanoideja valmistavat yritykset valmistavat myös muita tuotteita. Esimerkiksi Zhiyuanilla on kaupallinen siivousrobotti, Zhuji ja Yushu valmistavat molemmat robottikoiria, kun taas Yhdysvallat tuo enimmäkseen suoraan markkinoille humanoidirobotteja. Miksi tämä ero on?

Wang He: Pääoman runsaus Kiinassa ja Yhdysvalloissa on erilainen. Yhdysvalloissa, koska heillä on rahaa, he tekevät sen kerralla. Yritykset, kuten Figure AI ja Tesla, käyttävät kaikki humanoidimalleja. Kuitenkin, Figure AI:n nykyinen arvostus on 2,5 miljardia dollaria, eikä demossa näytetyillä toimilla ole mitään tekemistä urheilullisen kyvyn kanssa. Yhdysvaltojen kupla estää heitä ajattelemasta erittäin tiukkaa PMF:ää (tuotemarkkinoiden sovitus).

Tämän vuoden elokuussa FigureAI julkaisi uuden robotin, Figure 02, joka pystyy jo tekemään joitain kokoonpanodemoja BMW-autotehtaalla.

"Myöhemmin": Onko mielestäsi oikeampi tapa ajatella tuotteen käyttöönottoa alusta alkaen. Onko tämä liian ahdistunut huippuluokan alalla, kuten humanoidirobotit?

Wang He: Toisaalta se on edelleen tietoongelma. Ruumiillinen älykkyys on sidottu laitteistoon, joten jos robottia ei oteta käyttöön kohtauksessa, suuren datamäärän saaminen on vaikeaa. Mutta sitä ei voi jakaa suuria määriä ilmaiseksi, koska rungon rakentamiskustannukset ovat liian korkeat. Suuria malleja ei tarvitse kaupallistaa tiedon saamiseksi, koska niiden popularisoinnin kustannukset ovat edelleen paljon alhaisemmat kuin robottien.

Samalla robotti tarvitsee myös kiillotusta. Ilman robotin pitkäaikaista tarkkailua paikan päällä on mahdotonta iteroida robottia tilaan, jossa se voi toimia vakaasti. Tämä on myös syy siihen, miksi robotiikkaradalla ei ole PPT-yrityksiä.

"Myöhemmin": Millaista tuotetoteutusta olet nähnyt?

Wang He: Ensimmäinen askel on suorittaa yksi toimenpide useille kohteille yhdessä ympäristössä, kuten eri asioiden siirtäminen samassa tehtaassa tai samalla tuotantolinjalla. Näin tekevät nyt Google RT-1 ja Tesla Optimus, mutta Optimus käsittelee vähemmän kohteita. Molemmat eivät ole todella yleisiä, toisin sanoen yleismaailmallisia, eivätkä ne voi vielä ansaita rahaa.

Seuraava askel on, että robotit suorittavat samat toiminnot eri kohteissa eri skenaarioissa samalla alalla. Esimerkiksi teollisessa valmistusteollisuudessa se on laajentunut mahdollisuudesta saada osia autotehtaista, jotta se voisi saada kaikki osat missä tahansa vähittäiskaupan tehtaissa. Se on laajentunut tavaroiden varastoinnista pienissä supermarketeissa voi varastoida tavaroita Wal-Martissa. Yksi koulutustilaisuus eri skenaarioiden purkamiseksi samalla alalla on suuri arvo.

Seuraava askel on saada enemmän tehtäviä, enemmän skenaarioita, käsitellä kaikkia toimialoja ja jatkaa yleistymistä.

"Myöhemmin": Koko teollisuus ottaa nyt ensimmäisen askeleen. Kuinka valitset ensimmäisen kohtauksen tai ensimmäisen kohtauksen tällä hetkellä?

Wang He: Millä tahansa alalla, niin kauan kuin kyseessä on joustava tuotanto mutta ei täysin automatisoitu skenaario, ruumiillistuneita älykkäitä robotteja otetaan todennäköisesti käyttöön. Erityisesti teollisuudessa on huomaamattomia toimintoja. Kysyntä voi olla vahvaa ja tarvittava teknologia ei välttämättä ole monimutkaista.

Meidän on tehtävä se yksitellen helposta vaikeaan, korkeista työvoimakustannuksista alhaisiin työvoimakustannuksiin, suuresta kysynnästä alhaiseen kysyntään.

"Myöhemmin": Onko lääkkeiden hankkiminen apteekista mainitsemasi logiikan mukaista? Vai teitkö tämän kohtauksen, koska Meituan äänesti sinua?

Wang He: Haluamme olla ensimmäinen, joka tarttuu tuottoisiin, arvokkaisiin skenaarioihin, jotka voidaan muuntaa vahvemmiksi monipuolisiksi Tulevaisuuden tavoitteemme on päästä kotiin.

B to C soveltuu paremmin kotikäyttöön kuin puhdas B:lle, joten luomme vähittäiskaupassa B to C -skenen ollaksemme vuorovaikutuksessa ihmisten kanssa.

"Myöhemmin": Milloin ensimmäinen robotti julkaistaan?

Wang He: Otamme vastaan ​​tämän vuoden neljännellä vuosineljänneksellä pieniä erätilauksia, joiden hinta on 500 000.

"Myöhemmin": Onko lääkkeen saaminen apteekista liian kallista?

Wang He: Meillä on nyt kaksi pääasiallista myyntisuuntaa, tieteelliset tutkimusskenaariot ja kaupalliset skenaariot, kuten Meituan. Näiden skenaarioiden hinnat ja kokoonpanot ovat erilaisia.

Se, mitä myymme tieteellisille tutkimusskenaarioille, on kehitettävissä oleva versio, jossa on riittävä laskentateho. Kaupallisille skenaarioille myymämme tuotteet eivät tue kehitystä, vaan lisäävät joitain toimintoja ja vähentävät muita tarpeettomia toimintoja ja laskentatehoa. Esimerkiksi robotit on nyt varustettu OrinX-korteilla, mutta kaupallisissa skenaarioissa tietojenkäsittely voidaan sijoittaa pilveen. .

Tieteellisen tutkimuksen kohtauksiin on nyt tehty kymmeniä varauksia. Liiketoiminnan skenaarioissa koneista palveluihin tiimimme on vastuussa koko prosessista.

"Myöhemmin": Sanoit kerran, että Galaxyn odotetaan hallitsevan robottien kustannukset 50 000 yuania.

Wang He: Emme voi tehdä sitä tänä vuonna, mutta kun saavutamme 1 000 tai 10 000 yksikköä, tulemme edelleen lähemmäs tätä tavoitetta.

"Myöhemmin": On vitsi, että humanoidirobottien myyntiä Kiinassa tukevat startupit, yliopistojen laboratoriot ja muut vertaisryhmät.

Wang He: Tieteellisen tutkimuksen katto on ehdottomasti matala, mutta tieteellinen tutkimus on ensimmäinen askel. Yhden vuoden ikäisen yrityksen on mahdotonta myydä tuhatta robottia, ellei se ole lelu.

"Myöhemmin": Olemme puhuneet paljon nykyisestä epäyhtenäisyydestä ruumiillisessa tiedusteluteollisuudessa. Mikä mielestäsi on nykyinen konsensus?

Wang He: Toistaiseksi ei ole ilmennyt ruumiillistuneen älykkyyden skenaariota, joka voisi tuottaa laajamittaista taloudellista hyötyä. Ei ole yksimielisyyttä siitä, kuinka tehdä rahaa, joten ei ole yksimielisyyttä tuotteen muodosta, teknologiasta, toimialasta ja skenaarioista, jotka siirretään taaksepäin.

Konsensuksen puuttuminen on hyvä asia. Toisin sanoen, jos kaikki pääsevät yhteisymmärrykseen, viimeinen taistelu tulee olemaan kustannukset, resurssit ja yhteydet. Nämä tekijät eivät ole sitä, missä yrittäjät ovat hyviä, ja ne ovat haitallisia yrittäjyydelle.

Mutta kuvitella tulevaisuutta, tekniikan loppua, astu kotiin + täysi humanoidi + suuri malli, pelkään, että kaikki voivat olla samaa mieltä tästä.

"Myöhemmin": Miten kuvailisit sitä suurta määrää uusia yrityksiä, jotka nyt harjoittavat Embodidia? AGI matka?

Wang He: Tämä on prosessi, jossa ihmiset pelaavat jälleen luojan roolia. Autoteollisuus on myös täysin ihmisten luoma toimiala, ja sama pätee jatkossa yleiskäyttöisiin robotteihin. Mukana on myös Teslan kaltaisia ​​johtavia autoyrityksiä.