Googlen robotiikan asiantuntija: tekoäly osuu myös samaan seinään, jonka robotit kohtaavat reality

Googlen robotiikan asiantuntija: tekoäly osuu myös samaan seinään, jonka robotit ovat kohdanneet todellisuudessa

2024-07-16

Koneen sydänraportti

Toimittaja: Zhang Qian

"Koneoppiminen on elänyt kuplassa, jota robotikot, kemistit, biologit ja neurotieteilijät kadehtivat, ja kun se todella alkaa leviämään, kohtaamme kaikki samat ongelmat, joita kaikki muut ovat joutuneet käsittelemään vuosia. realistisia esteitä."

Jotkut sanovat, että edistyminen robotiikan alalla on hidasta tai jopa edistymätöntä verrattuna muihin koneoppimisen osa-alueisiin.

Alex Irpan, Google DeepMindin robotiikkatutkija ja ruumiillistuneiden älykkyysprojektien, kuten SayCan, RT-1 ja RT-2, osallistuja, on samaa mieltä. Mutta hän uskoo, että tämä johtuu siitä, että robotiikka on ala, joka liittyy läheisesti todellisuuteen, ja todellisuuden monimutkaisuus määrää, että ne törmäävät väistämättä seinään. Hän huomautti myös, että nämä ongelmat eivät ole ainutlaatuisia robotiikassa. Sama ongelma koskee tekniikoita, kuten suuria kielimalleja (LLM). Nämä mallit kohtaavat samanlaisia monimutkaisia asioita kuin robotiikka, kun he kohtaavat todellisen maailman.

Äskettäin hän kirjoitti blogin nimeltä "The Tragedies of Reality Are Coming for You" valaisemaan tätä kohtaa.

Todellisuuden tragedia on tulossa sinulle

Vuonna 2023 osallistuin ML-konferenssiin. Ye Weiyang oli humalassa, ja aihe kääntyi kysymykseksi: "Jos voisit antaa minkä tahansa koneoppimisen osakentän resurssit toiselle osa-alalle, minkä katkaisisit ja kenelle antaisit resurssit?"

En muista mitä kukaan sanoi, mutta yksi henkilö sanoi, että he aikoivat pilkkoa robotit. Kun painoin lisää, he sanoivat, että robotiikka etenee liian hitaasti ja että mitään ei tapahdu suhteessa muihin aloihin.

He sanovat, että robotiikka on edennyt hitaammin kuin koneoppimisen puhtaasti ohjelmistoala, ja mielestäni he ovat oikeassa, mutta haluaisin lisätä vielä kaksi seikkaa:

Syy siihen, että robotit oppivat hitaammin, johtuu siitä, että on vaikea saada aikaan muutosta ratkaisematta vaikeita ongelmia.
Robotiikan haasteet eivät ole ainutlaatuisia roboteille.

Robotiikan alalla yleinen sanonta on, että "todellisuus on sotkuinen". Suhteessa koodiin, laajentaisin tätä "todellisuus on monimutkaista". Robotiikassa on taipumus työntää sotkuinen todellisuus riittävän hyvälle abstraktiotasolle, jotta koodi voi toimia sen päällä. Tietojenkäsittelytiede on alana käyttänyt vuosikymmeniä luoden hyviä abstraktiokerroksia laitteiston ja ohjelmiston välille. Koodi kuvaa, kuinka virtaa syötetään kiintolevylle, prosessorille ja näytölle, ja se on tarpeeksi luotettava, ettei minun tarvitse edes ajatella sitä.

Tästä on monia etuja. Kun olet tehnyt kovan työn ja siirtänyt työsi edistymisen abstraktiin loogiseen tilaan, kaikki helpottuu. Koodi ja tiedot ovat uskomattoman toistettavissa. Synkronoin tämän blogiviestin luonnosta edustavan tiedoston kopiot kolmelle laitteelle miettimättä.

Kuitenkin, kuten Joel Spolsky sanoi, kaikissa abstraktioissa on jossain määrin reikiä, ja huomaan, että robotiikassa aukot ovat yleensä vielä suurempia. Asiat voivat mennä pieleen monella tapaa, joilla ei ole mitään tekemistä koodisi oikeellisuuden kanssa.

Onko tällä tekemistä joidenkin aiheen perusperiaatteiden kanssa? Vähän. Monet robotiikkalaitteistot ovat enemmän kokeellisia kuin kannettavat tietokoneet tai Linux-palvelimet. Kuluttajarobotiikka ei ole vielä suuri toimiala. "Kokeellinen" tarkoittaa usein "outoja, epäonnistumiselle alttiimpia tiloja".

En kuitenkaan usko, että laitteisto on suurin syy ongelmaan. Todellisuus on ongelman ydin. Benjamin Holson ilmaisee sen erittäin hyvin artikkelissaan "Myyttinen ei-robotikko":

Ensimmäinen vaikeus on se, että robottien on kohdattava epätäydellinen havainto ja epätäydellinen toteutus todellisessa maailmassa. Globaalisti muuttuva tila on huono ohjelmointityyli, koska sitä on todella vaikea käsitellä, mutta robottiohjelmistoille koko fyysinen maailma on globaalisti muuttuva tila ja sitä voi vain tarkkailla epäluotettavasti ja toivoa, että toimintosi tuo sinut lähemmäksi sitä, mitä haluat saavuttaa.

Robotiikkatutkimus perustuu uusien siltojen rakentamiseen todellisuuden ja ohjelmistojen välille, mutta tämä tapahtuu myös robotiikan tutkimuksen ulkopuolella. Kaikilla ohjelmistoilla, jotka liittyvät todellisuuteen, on epätäydellinen käsitys todellisuudesta. Jokaisen ohjelmiston, joka yrittää vaikuttaa muutokseen todellisessa maailmassa, on käsiteltävä globaalisti muuttuvaa todellisuuden tilaa. Kaikki ohjelmistot, joiden käyttäytyminen riippuu todellisuudessa tapahtuvasta, aiheuttavat kiistanalaista melua ja monimutkaisuutta.

Game AI on hyvä esimerkki. Shakki-AI on yli-inhimillisen luotettava. Jotkut yli-inhimilliset Go AI:t voidaan kuitenkin voittaa, jos pelaat shakkia tietyllä tavalla, kuten Tony T. Wang ym. totesivat ICML 2023 -julkaisussa "Adversarial Policies Beat Superhuman Go AIs". Vastakkaiset tekniikat löytävät strategioita, jotka ovat riittävän selkeitä, jotta ihmiset voivat toistaa niitä.

Liitteessä G.2 yksi kirjoittajistamme, Go-asiantuntija, pystyi toteuttamaan tämän [syklisen] hyökkäyksen oppimalla vastustajan peliennätyksiä ilman algoritmista apua. He pelasivat normaaleissa ihmisolosuhteissa KGS online Go -palvelimella ja saavuttivat yli 90 % voittoprosentin parhaissa KataGo-robottipeleissä, jotka eivät liity kirjailijaan.
Kirjoittaja onnistui jopa voittamaan antamalla robotille 9 tasoitusta, mikä on valtava etu: ihmisammattilainen, jolla on nämä tasot, voittaisi melkein 100 % mitä tahansa vastustajaa vastaan, oli se sitten ihminen tai tekoäly. He voittivat myös KataGon ja Leela Zeron, jotka molemmat suorittivat 100 000 hakua peliä kohti, mikä on tyypillisesti reilusti ihmisten kykyjen yläpuolella. Siitä lähtien muut ihmiset ovat käyttäneet syklistä hyökkäystä kukistaakseen useita muita Go AI:ita.

Samaan aikaan OpenAI loi muutama vuosi sitten järjestelmän, joka voitti Dota 2:n hallitsevan maailmanmestarin. Kun järjestelmä oli avattu yleisölle testaamaan sen kestävyyttä, yksi joukkue kehitti strategian, joka johti 10 pelin voittoputkeen.

Tämän perusteella saatat omaksua pessimistisen näkemyksen, että jopa yksinkertaisessa "todellisuudessa", kuten 19 x 19 Go -levyn tai Dota 2:n yhdistämisessä, on tarpeeksi monimutkaisuutta tehdäkseen vankasta käyttäytymisestä haastavaa. Mielestäni tämä näkemys on epäreilu, koska kummallakaan järjestelmällä ei ole kestävyyttä korkeimpana tavoitteena, mutta mielestäni ne tekevät mielenkiintoisen tapaustutkimuksen.

Viime aikoina LLM:ien ympärillä on ollut hype-aalto – mitä he voivat tehdä ja missä niitä voidaan soveltaa. Tähän sisältyy implisiittisesti usko, että LLM voi muuttaa dramaattisesti tapaa, jolla ihmiset ovat vuorovaikutuksessa teknologian kanssa työssä ja vapaa-ajalla. Toisin sanoen LLM muuttaa tapaamme olla vuorovaikutuksessa todellisuuden kanssa. Itse asiassa olen hypännyt hype-kelkkaan, erityisesti epäilykseni, että taustalla olevaa mallia on ylihypotettu lyhyellä aikavälillä ja alihyytetty pitkällä aikavälillä. Se tarkoittaa kuitenkin myös sitä, että alalle, joka on historiallisesti ollut huono ottamaan todellisuutta huomioon, on tulossa koko todellisuuden kaaos.

Samassa ML-konferenssissa, jossa tämä kaveri sanoi, että robotiikka on resurssien tuhlausta, mainitsin, että teimme perusmallikokeita oikeilla roboteilla. Jotkut ihmiset sanoivat, että se tuntui hieman pelottavalta, ja minä vakuutin heille, että se oli vain tutkimuksen prototyyppi. Mutta pidän myös LLM:n luonti- ja suoritusohjelmistoa hieman pelottavana, ja minusta on mielenkiintoista, että he ovat epämääräisesti huolissaan toisesta, mutta eivät toisesta. Ihmiset Piilaaksossa ovat hieman ristiriitaisia. He uskovat, että ohjelmistot voivat saada start-up-yritykset saavuttamaan hämmästyttäviä muutoksia ja että heidän ohjelmistonsa eivät ole ajattelun tai pohdinnan arvoisia. Uskon, että bittien maailma on yhtä paljon todellisuutta kuin atomien maailma. Ne toimivat eri tasoilla, mutta ovat kaikki osa todellisuutta.

Olen huomannut (jollakin schadenfreudella), että LLM:n harjoittajat alkavat kohdata samoja kipupisteitä, joita robotiikka on kohdannut aiemmin. Esimerkiksi "Emme voi toistaa näitä koulutuksia, koska ne ovat liian kalliita." Kyllä, tästä aiheesta on keskusteltu robotiikka-alalla ainakin kymmenen vuotta. Toinen esimerkki: "En voi saada Bingiä kertomaan minulle Avatar 2:n julkaisupäivää, koska se kerää jatkuvasti uutisraportteja itsestään ja korjaa itseään ennen niiden luomista."

Elämme nyt maailmassa, jossa kaikki Internetissä julkisesti saatavilla olevat tekstit vaikuttavat peruuttamattomasti hakujen parannusten luomiseen. Tervetuloa globaaliin muuttuvaan tilaan. Aina kun näen jonkun väittävän, että ChatGPT:n käyttäytyminen on taantunut, ajattelen erilaisia "salaliittoteorioita", joita minä ja muut olemme keksineet selittääkseen robotin suorituskyvyn äkillistä ja selittämätöntä heikkenemistä ja onko ongelma mallissa vai ympäristössä. Vai onko se meidän liiallinen päätelmä.

Kuten sanonta kuuluu, "kaikki robottidemot valehtelevat", ihmiset huomaavat, että kaikki LLM-demot myös valehtelevat. Minusta tämä on pohjimmiltaan väistämätöntä, koska ihmisen huomiokyky on rajallinen. On tärkeää arvioida valheen tyyppi, koko ja merkitys. Näyttävätkö ne kuinka malli/botti yleistää? Mainitsiko he, kuinka huolellisesti nämä esimerkit on valittu? Nämä ongelmat monimutkaistuvat, kun todellisuus yhdistyy. Messi näyttää tällä hetkellä hyvältä pelaajalta, mutta "voiko hän tehdä sen kylmänä, sateisena yönä Stoke Cityssä"?

Asiaa mutkistaa, että vastaus näihin kysymyksiin ei aina ole "ei". Messi voisi tehdä sen kylmänä, sateisena yönä Stoke Cityssä. Hän on tarpeeksi hyvä. Tämä tekee kysymyksestä vaikean, koska on paljon tärkeämpää vastata oikein "kyllä" kuin vastata oikein "ei". LLM:n parantuessa ja tekoälyn yleistyessä jokapäiväisessä elämässä meidän on yhteiskunnana parannettava ja arvioitava, onko malli osoittautunut hyväksi. Yksi suurimmista huolenaiheistani tulevaisuuden suhteen on se, että emme ole hyviä arvioimaan, ovatko mallit osoittautuneet hyväksi.

Odotan kuitenkin robotiikkojen olevan edelläkävijöitä. Valitimme arviointiongelmista ennen kuin ilmaantui ehdotus, että LLM manipuloi yleisiä vertailuarvoja. Kauan ennen kuin "tarvitsemme parempaa datakattavuutta" tuli perusmallin esikoulutustiimin iskulauseeksi, työskentelimme kovasti saadaksemme tarpeeksi tietoa taltioidaksemme autonomisen ajamisen pitkän hännän. Koneoppiminen on elänyt kuplassa, jota robotikot, kemistit, biologit ja neurotieteilijät kadehtivat, ja kun se todella alkaa leviämään, kohtaamme kaikki samat ongelmat, joita kaikki muut ovat joutuneet käsittelemään vuosia. Realistiset esteet. Nämä haasteet voidaan voittaa, mutta ne ovat vaikeita. Tervetuloa oikeaan maailmaan. Tervetuloa kivun maailmaan.

Alkuperäinen linkki: https://www.alexirpan.com/2024/07/08/tragedies-of-reality.html

uutiset

Googlen robotiikan asiantuntija: tekoäly osuu myös samaan seinään, jonka robotit ovat kohdanneet todellisuudessa

Johdanto

yhteystietoni