uutiset

Neuroverkoilla on myös tilatietoisuus!Opi luomaan karttoja Minecraftissa, joka on julkaistu Nature-alalehdessä

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Koneen sydänraportti

Machine Heart -toimitusosasto

Tämä on ensimmäinen kerta, kun ihmiset ovat osoittaneet, että hermoverkot voivat luoda omia karttojaan.

Kuvittele, että olet vieraassa kaupungissa, vaikka ympäröivä ympäristö olisi aluksi tuntematon, voit tutkia ympärilläsi ja lopulta piirtää aivoihisi ympäristökartan, joka sisältää rakennuksia, katuja, kylttejä jne., jotka ovat vuorovaikutuksessa keskenään. paikallinen suhde niiden välillä. Tämä kyky rakentaa spatiaalisia karttoja aivoissa on ihmisten korkeamman asteen kognition taustalla: esimerkiksi kielen on teoriassa koodattu aivojen karttamaisten rakenteiden avulla.

Edes kehittynein tekoäly ja hermoverkot eivät kuitenkaan pysty rakentamaan tällaista karttaa tyhjästä.

Matt Thomson, laskennallisen biologian apulaisprofessori ja tutkija Heritage Medical Research Institutesta, sanoi: "On tunne, etteivät edes edistyneimmät tekoälymallit ole todella älykkäitä. Ne eivät voi ratkaista ongelmia kuten me; ne eivät voi todistaa todistamattomia matemaattisia tuloksia ei voi luoda uusia ideoita."

"Mielestämme se johtuu siitä, että he eivät pysty navigoimaan käsitteellisessä tilassa; monimutkaisten ongelmien ratkaiseminen on kuin liikkumista käsitteellisessä tilassa, aivan kuten navigointi. Se, mitä tekoäly tekee, on enemmän kuin paikan päällä oppimista – annat sille syötteen ja se antaa sinulle vastauksen. Mutta se ei voi syntetisoida erilaisia ​​ideoita."

Äskettäin uusi Thomson Laboratoryn paperi totesi, että hermoverkot voivat käyttää "ennustavaa koodausta" kutsuttua algoritmia tilakarttojen rakentamiseen. Artikkeli julkaistiin Nature Machine Intelligence -lehdessä 18. heinäkuuta.



  • Paperin osoite: https://www.nature.com/articles/s42256-024-00863-1
  • Koodin osoite: https://github.com/jgornet/predictive-coding-recovers-maps

Jatko-opiskelija James Gornetin johdolla Minecraft-pelin kaksi rakennettua ympäristöä sisältävät monimutkaisia ​​elementtejä, kuten puita, jokia ja luolia. He nauhoittivat videoita pelaajista, jotka kävelivät satunnaisesti alueen läpi ja käyttivät videoita opettaakseen ennakoivalla koodausalgoritmilla varustettua neuroverkkoa.

He havaitsivat, että hermoverkko voisi oppia, kuinka Minecraft-maailman objektit organisoituivat keskenään, ja voisi "ennustaa" ympäristön, jonka se kohtaa liikkuessaan avaruudessa.



Ennustavan koodausalgoritmien ja Minecraft-pelin yhdistelmä "opetti" hermoverkon onnistuneesti luomaan spatiaalisia karttoja ja käyttämään näitä spatiaalisia karttoja videon seuraavien ruutujen ennustamiseen, mikä johti vain 0,094 %:n keskimääräiseen neliövirheeseen ennustetun kuvan välillä. ja lopullinen kuva.

Lisäksi ryhmä "käynnisti" neuroverkon (vastaa sisäisen rakenteen tutkimista) ja havaitsi, että eri objektien esitykset on tallennettu spatiaalisesti toisiinsa nähden. Toisin sanoen he näkivät neuroverkkoon tallennetun Minecraft-ympäristön kartan.

Hermoverkot voivat navigoida ihmissuunnittelijoiden niille antamissa kartoissa, kuten itse ajavissa autoissa GPS:n avulla, muttaTämä on ensimmäinen kerta, kun ihmiset ovat osoittaneet, että hermoverkot voivat luoda omia karttojaan . Tämä kyky tallentaa ja järjestää tietoa spatiaalisesti auttaa lopulta hermoverkkoja muuttumaan "älykkäämmiksi", jolloin ne voivat ratkaista todella monimutkaisia ​​ongelmia, kuten ihmisten.

Tämä projekti osoittaa tekoälyn todelliset tilatietoisuuden mahdollisuudet, joita ei vieläkään näe sellaisissa teknologioissa kuin OpenAI:n Sora, jälkimmäisessä on outoja vikoja.

James Gornet on opiskelija Caltechin Computational and Neural Systems (CNS) -osastolla, joka kattaa neurotieteen, koneoppimisen, matematiikan, tilastot ja biologian.

"CNS-ohjelma todella tarjoaa Jamesille paikan tehdä ainutlaatuista työtä, joka ei olisi mahdollista muualla", Thomson sanoi. "Otamme biologisesti inspiroidun koneoppimislähestymistavan, jonka avulla voimme kääntää aivojen ominaisuuksia keinotekoisissa hermoverkoissa, ja toivomme vuorostaan ​​ymmärtävämme aivoja työyhteisö."

Neuraaliverkko, joka suorittaa ennakoivaa koodausta

Ennustavan koodauksen päättelyongelmien implisiittisen spatiaalisen esityksen innoittamana tutkijat kehittivät ennustavan koodausagentin laskennallisen toteutuksen ja tutkivat agentin oppimaa spatiaalista esitystapaa tutkiessaan virtuaaliympäristöä.

He loivat ensin ympäristön käyttämällä Malmön ympäristöä Minecraftissa. Fyysisen ympäristön mitat ovat 40 × 65 laatta, ja se kattaa kolme visuaalisen kohtauksen aspektia: luola tarjoaa maailmanlaajuisen visuaalisen maamerkin, metsä mahdollistaa visuaalisten kohtausten samankaltaisuuden ja joki sillalla rajoittaa visuaalista kohtausta ympäristöön (kuva 1a).



Agentti seuraa A*-haulla määritettyä polkua löytääkseen lyhimmän polun satunnaisesti otettujen paikkojen välillä ja vastaanottaa visuaalisen kuvan jokaisesta polusta.

Ennustavan koodauksen suorittamiseksi kirjoittaja rakensi enkooderi-dekooderikonvoluutiohermoverkon. Enkooderi ottaa käyttöön ResNet-18-arkkitehtuurin ja dekooderi ottaa käyttöön transponoidun konvoluutio-ResNet-18-arkkitehtuurin (kuva 1b). Enkooderi-dekooderi-arkkitehtuuri käyttää U-Net-arkkitehtuuria välittämään koodatut piilevät yksiköt dekooderiin. Monen pään huomionkäsittely koodaa piileviä yksikkösekvenssejä aiempien visuaalisten havaintojen historian koodaamiseksi. Monipäisellä huomiolla on h = 8 päätä. Koodaavalla latentilla yksiköllä, jonka mitat ovat D = C × H × W, joiden korkeus on H, leveys W ja kanava C, yksittäisen pään mitat ovat d = C × H × W/h.



Ennustavat kooderit arvioivat ennakoivaa koodausta minimoimalla todellisten havaintojen ja ennustettujen havaintojen välisen keskineliövirheen. Ennustavaa enkooderia harjoiteltiin 200 jaksoa varten 82 630 näytteellä käyttämällä gradientin laskeutumisen optimointia Nesterovin liikemäärällä, painon heikkenemistä 5 × 10^(-6), oppimisnopeutta 10^(-1) ja läpäistiin OneCycle Oppimisnopeusaikataulu. on säädetty. Optimoidun ennustavan kooderin ennustetun kuvan ja todellisen kuvan välinen keskimääräinen neliövirhe on 0,094, kun visuaalinen tarkkuus on hyvä (kuva 1c).



Katso lisätietoja alkuperäisestä paperista.

https://techxplore.com/news/2024-07-neural-network-minecraft.html

https://www.tomshardware.com/tech-industry/artificial-intelligence/neural-network-learns-to-make-maps-with-minecraft-code-available-on-github