Ma Yi Hongkongin yliopistosta: Suuret mallit ilman teoriaa pitkään ovat kuin sokeat ihmiset, jotka yrittävät tarttua elefanttiin. Suuret nimet kokoontuvat puhumaan AI

Hongkongin rahoitus- ja talousyliopisto Ma Yi: Suuret mallit ilman teoriaa pitkään ovat kuin sokeat ihmiset, jotka tuntevat elefantin suuret nimet kokoontuvat keskustelemaan tekoälyn seuraavasta vaiheesta

2024-07-24

Länsituuli tulee Aofein temppelistä
Qubits |. Julkinen tili QbitAI

"Haluan kysyä sinulta kysymyksen. Olitpa Qiuzhen Academyn tai Qiu Chengtongin junioriluokan opiskelija, jos et tiedä tätä kysymystä, sinun ei pitäisi olla tällä luokalla!"

Vuoden 2024 kansainvälisessä perustieteiden konferenssissa "Basic Science and Artificial Intelligence Forum", Lenovo Groupin teknologiajohtaja ja Euroopan tiedeakatemian ulkomainen akateemikkoRui YongHeti kun nämä sanat tulivat esiin, koko yleisö hermostui.

Mutta sitten hänen esittämä kysymys oli:Kumpi on isompi, 13.11 vai 13.8?

Hei kaverit, kysykää vain, kuka ei vielä tiedä tätä vitsiä.

Tällä kertaa kyse ei kuitenkaan ole mallin hulluuden pilkkaamisesta. Useat tekoälyasiantuntijat akateemisesta ja teollisuudesta analysoivat useita ongelmia, kuten mallin "illuusiota", ja saivat mielipiteitään "Mikä on tekoälyn seuraava askel?" mielipide.

Yhteenvetona se sisältää seuraavat kohdat:

Seuraava askel suurten mallien kehittämisessä on siirtyä pois hakuparadigmasta "ei abstraktia kykyä, ei subjektiivista arvoa eikä tunnetietoa".
Kaupalliset sovellukset jäävät jälkeen itse mallin mittakaavakasvusta, ja supertuotteesta, joka todella heijastaisi investoinnin arvoa, puuttuu.
Illuusion rajoituksen alaisena seuraava askel voi olla mallin yleistämisen laajentaminen ja vuorovaikutteisuus on vaihtoehto.
Älykkään agentin kannalta on erittäin tärkeää tietää kykyjensä rajat.

Hongkongin yliopiston Data Schoolin dekaani ja Hongkongin yliopiston tietojenkäsittelytieteen osaston puheenjohtajaSaankoKeskustelun aikana heräsi jopa kysymysmerkki valtavirran tällä hetkellä käyttämästä "tekoälystä":

Tekoälyteknologian kehittämiseen on kertynyt paljon kokemusta, joista osaa voimme selittää ja osaa emme selittää Nyt on aika, jolloin teoriaa tarvitaan kovasti. Itse asiassa voidaan sanoa, että apurahamme ei ole tehnyt juurikaan läpimurtoja viimeisen kymmenen vuoden aikana. On todennäköistä, että teollisuuden ja tekniikan nopea kehitys on vaikuttanut akateemisten tahojen tahtiin.

Katsotaanpa, mitä isot kaverit sanoivat erityisesti.

Mikä on älykkyyden luonne?

Paikalla Hongkongin yliopiston Data Schoolin dekaani ja Hongkongin yliopiston tietojenkäsittelytieteen osaston puheenjohtajaSaanko, piti pääpuheen "Paluun teorian perusteisiin ja älykkyyden olemuksen tutkimiseen".

Esitetyt näkemykset ovat yhtäpitäviä pyöreän pöydän keskustelujen kanssa.

Professori Ma Yin puheen teemana oli "Palaaminen teorian perusteisiin ja älykkyyden olemuksen tutkiminen".

Hän puhui ensin elämän ja älykkyyden kehityksestä.

Hänen henkilökohtaisen näkemyksensä mukaan elämä on älyn kantaja, ja elämän kyky tuottaa ja kehittyä on älykkäiden mekanismien toiminnan tulos. ja,Maailma ei ole satunnainen, se on ennustettavissa, jatkuvan evoluution prosessissa elämä oppii enemmän ennustettavaa tietoa maailmasta.

Sopivimpien selviytyminen luonnollisen valinnan kautta on eräänlainen palaute älykkyydestä, samanlainen kuin nykyinen vahvistusoppimisen käsite.

Kasveista eläimiin, matelijoihin, lintuihin ja sitten ihmisiin elämä on parantanut älykkyyttään, mutta on ilmiö, joka näyttää siltä, että mitä älykkäämpi elämä on, sitä kauemmin se seuraa vanhempiaan syntymän jälkeen. Miksi?

Professori Ma Yi selitti edelleen: Koska geenit eivät riitä, jotkut kyvyt on opittava. Mitä vahvempi oppimiskyky, sitä enemmän asioita on opittava. Tämä on edistyneempi älykkyyden muoto.

Jos opimme yksilöllisesti, se ei ole tarpeeksi nopeaa tai tarpeeksi hyvää, joten ihmiset keksivät kielen, ja ihmisälystä tuli eräs ryhmäälyn muoto.

Ryhmäälyä tuotettiin ja laadullinen muutos tapahtui.Emme vain opi näitä ennustettavia ilmiöitä empiiristen havaintojen perusteella;abstrakti looginen ajattelu, kutsumme sitä ihmisälyksi tai myöhemmin tekoälyksi.

Seuraavaksi hän puhui koneälyn alkuperästä.

1940-luvulta lähtien ihmiset ovat alkaneet yrittää antaa koneiden simuloida elävien olentojen, erityisesti eläinten, älykkyyttä.

Ihmiset alkoivat mallintaa neuroneja ja tutkia "miten aivojen havainnointi toimii". Myöhemmin kaikki huomasivat, että eläinten hermoston simulointi pitäisi rakentaa keinotekoisista hermoverkoista, ja tutkimuksesta tuli yhä monimutkaisempi.

Asia ei ole sujunut sujuvasti Kahden kylmän talven jälkeen kaikki löysivät joitain hermoverkkojen rajoituksia, ja jotkut ihmiset vaativat edelleen näiden haasteiden ratkaisemista.

Myöhemmin datan laskentateho kehittyi ja hermoverkkojen kouluttaminen alkoi kehittyä yhä syvemmälle, ja niiden suorituskyky parani.

Mutta suurin ongelma on:Nämä verkot on suunniteltu empiirisesti. Se on musta laatikko, ja laatikko kasvaa ja kasvaa.

Mitä vikaa mustassa laatikossa on? Teknisestä näkökulmasta kokemussuunnittelu on myös mahdollista ja yritys- ja erehdystä voidaan jatkaa. Kustannukset ovat kuitenkin korkeat, sykli on pitkä ja tuloksia on vaikea hallita. myös:

Niin kauan kuin maailmassa on tärkeä ilmiö, jota kukaan ei voi selittää, ja monet ihmiset ovat pimeässä, se aiheuttaa paniikkia.

Joten kuinka avata musta laatikko? Professori Ma Yi ehdotti palaamista alkuperäiseen kysymykseen: Miksi opiskella? Miksi elämä voi kehittyä?

Hän korosti erityisesti, että on puhuttava asioista, jotka voidaan toteuttaa laskemalla:

Älä puhu mistään abstraktista. Tämä on neuvoni kaikille. Sinun täytyy puhua siitä, kuinka tämä asia suoritetaan.

Joten mitä oppia?

Professori Ma Yi uskoo, että meidän pitäisi oppia asioita, jotka ovat ennakoitavissa ja säännöllisiä.

Jos esimerkiksi pidät kynää kädessäsi ja päästät irti, kaikki tietävät mitä tapahtuu, ja jos liikut nopeasti, voit saada sen kiinni. Tämä tiedettiin jo ennen Newtonia. Ihmisillä ja eläimillä näyttää olevan hyviä malleja ulkomaailmasta.

Ja matematiikassa,Ennustettava tieto heijastuu tasaisesti korkeadimensionaalisessa tilassa olevan datan matalaulotteisessa rakenteessa.。

Joten mikä on yhtenäinen laskentamekanismi? Professori Ma Yi vastasi:Samanlaiset asiat kerääntyvät yhteen ja erilaiset hylkivät toisiaan., ydin on niin yksinkertainen.

Kuinka mitata, onko jokin tehty hyvin? Miksi kompressio?

Hän antoi esimerkin, kuten alla näkyy. Esimerkiksi maailma on satunnainen, mitään ei tiedetä, ja kaikkea voi tapahtua, jos sen sijaan käytetään sinisiä palloja, kaikki siniset pallot voivat tapahtua seuraavan sekunnin aikana.

Mutta jos haluat muistaa, että jokin näistä tapahtui, sinun on koodattava koko tila, annettava sille koodi, ja vain vihreiden pallojen alue voi tapahtua, ja sinisiä palloja on paljon vähemmän.

Kun tiedämme, että alueet, joissa asioita tapahtuu, pienenevät, tiedämme maailmasta yhä vähemmän. Tätä informaatioteoria vahvisti 1940-luvulla.

Löytääksemme nämä viheralueet paremmin, meidän on järjestettävä ne paremmin aivoissa. Joten aivomme järjestävät tämän ilmiön ja tämän matalaulotteisen rakenteen.

Miten tämä voidaan saavuttaa laskennallisesti?

Professori Ma Yi sanoi, että kaikki syvät verkot itse asiassa tekevät tätä. Kuten Transformer nyt, se tekee tämän segmentoimalla kuvat ja luokittelemalla ne.

Itse asiassa jokainen hermoverkon kerros onPakkaa tiedot。

Matematiikalla on tässä erittäin tärkeä rooli. Sinun on mitattava tarkasti, mitä haluat optimoida. Kun olet tehnyt nämä kaksi asiaa, huomaat, että saamasi operaattori on sama kuin mitä olet löytänyt Nykyinen kokemus monet toimijat ovat hyvin samanlaisia.
Olipa kyseessä Transformer, ResNet tai CNN, he kaikki tekevät tämän eri tavoin. Ja se voidaan täysin selittää tilastollisesti ja geometrisesti, mitä se tekee.

muttaOptimoinnin optimaalinen ratkaisu itsessään ei välttämättä ole oikea ratkaisu , tärkeät tiedot voivat kadota pakkausprosessin aikana. Kuinka todistaa, että olemassa olevat tiedot ovat hyvät? Kuinka todistaa, että hallusinaatioita ei tapahdu?

Takaisin oppimisen perusteisiin, miksi meidän pitää muistaa nämä asiat?Se on olla sielläAivot simuloivat fyysistä maailmaa,Suorittaaksesi paremmin fyysisessä tilassaennustaa。

Myöhemmin Ma Yi mainitsi linjauksen käsitteen:

Joten linjaamisessa ei ole kyse ihmisten kanssa linjaamisesta, linjaamisesta on kyseMalli mukautuu siihen, mitä se on oppinut.

Ei riitä, että opetellaan autokoodausta sekä sisältä että ulkoa. Kuinka eläimet luonnossa oppivat ulkomaailman fyysisen mallin.

Käytä jatkuvasti omia havaintojasi ulkoisen maailman ennustamiseen, kunhan se on yhdenmukainen havaintojen kanssajohdonmukainen , se siitä. Tämä sisältää suljetun silmukan käsitteen.

Niin kauan kuin on eläviä olentoja, niin kauan kuin on älykkäitä olentoja, ne ovat kaikki suljettuja.

Professori Ma Yi huomautti sitten, että olemme vielä kaukana todellisesta älykkyydestä.

Mitä on älykkyys? Ihmiset sekoittavat usein tiedon ja älyn. Onko järjestelmällä älykkyyttä, jos sillä on tietoa? Älykkäällä järjestelmällä tulee olla perusta itsensä kehittämiseen ja oman tiedon lisäämiseen.

Lopuksi professori Ma Yi päätti.

Kun katson historiaa, 1940-luvulla kaikki halusivat koneita jäljitellä eläimiä, mutta 1950-luvulla Turing ehdotti yhtä asiaa - voivatko koneet ajatella kuten ihmiset. Dartmouthin konferenssissa vuonna 1956 ryhmä ihmisiä istui yhdessä ja heidän tarkoituksenaan oli tehdä jotainAinutlaatuinen älykkyys, joka erottaa ihmiset eläimistä：Abstrakti kyky, symboliset operaatiot, looginen päättely, syy-analyysiodota.

Tämä on se, mitä he määrittelivät tekoälyn tehtäväksi vuonna 1956. Myöhemmin nämä ihmiset voittivat periaatteessa Turing-palkinnon. Joten jos haluat voittaa Turing-palkinnon tulevaisuudessa, kannattaako seurata yleisöä tai tehdä jotain ainutlaatuista...

Kun katson taaksepäin, mitä olemme tehneet viimeisen 10 vuoden aikana?

Nykyinen "tekoäly" tekee kuvantunnistuksen, kuvan luomisen, tekstin luomisen, pakkaamisen ja kohinan poistamisen sekä vahvistavan oppimisen.Pohjimmiltaan se, mitä teemme, on eläintasolla., mukaan lukien seuraavan tunnuksen ja seuraavan kehyskuvan ennustaminen.

Kyse ei ole siitä, että meillä ei olisi ollut ihmisiä, jotka työskentelivät sen parissa myöhemmin. Mutta ei valtavirran suuri malli.

Hän selitti edelleen, että jos rahaa heitetään tarpeeksi ja dataa heitetään tarpeeksi, monien mallien suorituskyky kehittyy edelleen, mutta jos teoriaa ei ole pitkään aikaan, syntyy ongelmia, aivan kuten sokea yrittää arvata. ulos elefantista.

Professori Ma Yi sanoi, että henkilökohtaisen matkansa jakaminen toivoo inspiroivansa nuoria.

Kun meillä on periaatteet, voimme suunnitella rohkeasti, eikä enää tarvitse odottaa, että seuraava sukupolvi keksii hyvän näköisen verkon, ja voimme käyttää sitä yhdessä. Joten missä ovat mahdollisuutesi?

Katsotaanpa, kuinka muut tekoälyasiantuntijat vastasivat kysymykseen "Mikä on tekoälyn seuraava askel?"

Mikä on tekoälyn seuraava askel?

Suuret mallit vaativat "paradigman" muutoksia

Kuninkaallisen tekniikan akatemian, Euroopan tiedeakatemian, Hongkongin teknisten tieteiden akatemian jäsen ja Hongkongin tiede- ja teknologiayliopiston vararehtoriGuo YikeLuulen, että olemme erittäin mielenkiintoisessa hetkessä juuri nyt -

Koska skaalauslaki on laajalti hyväksytty, sadan mallin sota on vähitellen muodostanut resurssisodan.Näyttää siltä, että meidän tarvitsee tehdä vain kaksi asiaa Transformer-mallin jälkeen, mikä on ratkaistavaSuuri laskentatehojaSuuri dataOngelma.

Hänen mielestään näin ei kuitenkaan ole.Tekoälyn nykyinen kehitys kohtaa edelleen monia ongelmiaRajoitettu laskentateho ja loputon kysyntäOngelma.

Miten tässä tapauksessa pitäisi rakentaa suuri malli? Akateemikko Guo jakoi ajatuksiaan joidenkin käytäntöjen kautta.

Ensinnäkin akateemikko Guo mainitsi taloudellisemman MOE:n käytön laskentatehon rajoituksen alla.sekoitettu asiantuntijamalliSe voi myös saavuttaa erittäin hyviä tuloksia.

Lisäksi se, miten mallia kehitetään jatkuvasti uudella tiedolla harjoittelun jälkeen niin, että se muistaa, mitä pitäisi muistaa, unohtaa mitä pitäisi unohtaa ja pystyy muistamaan unohdetut asiat tarvittaessa, on myös vaikea kysymys.

Akateemikko Guo on eri mieltä joidenkin alan väitteiden kanssa, joiden mukaan "tiedot on käytetty loppuun". malleja tiedon tuottamiseksi.

Seuraavaksi kaikkia malleja ei tarvitse oppia tyhjästätiedon upottaminen perusmalliin. Tälläkin saralla on paljon tehtävää.

Laskentatehon lisäksi algoritmissa on toinen ongelma:Koneälyn ja ihmisälyn viljelyllä itsessään on kaksi napaisuutta。

Akateemikko Guo uskoo, että suuria malleja koulutettaessa tärkeämpi asia ei ole edessä, vaan takana.

Kuten alla olevasta kuvasta näkyy, suuren mallin evoluutiopolku lähtee itseoppimisesta > epäsuorasta tiedosta > arvoista > terveestä järjestä, kun taas ihmisen kasvatuksen kultivointipolku on päinvastainen.

Tästä syystä akateemikko Guo uskoo, että meidän pitäisi päästä eroon nykypäivän suurten mallien hakuparadigmasta, jossa "ei abstrakteja kykyjä, subjektiivista arvoa eikä tunnetietoa".

Me kaikki tiedämme, että ihmisen kieli on hienoa, ei vain sisältöä, vaan myös ihmisluonnetta ja tiedon energiaa. Miten nämä asiat luokitellaan malliin? Tämä on tärkeä suunta tulevalle tutkimuksellemme.

Yhteenvetona, mitä tulee tekoälyn seuraavaan vaiheeseen, akateemikko Guo uskoo, että kehitysvaiheita on kolme:

Ensimmäinen vaihe perustuu aitouteen. Koneen on kyettävä ilmaisemaan oma näkemyksensä ja muodostamaan oma subjektiivinen arvonsa, ja tätä näkökulmaa voidaan muuttaa ympäristönsä mukaan vaihe Vain kun sillä on arvoja, se voi ymmärtää mitä uutuus on, ja vain uutuuden avulla se voi luoda.

Tätä mallia luotaessa niin sanottu illuusio ei ole ongelma, koska illuusio on vain ongelma paradigmamallissa. Romaanin kirjoittamisen täytyy olla illuusiota. Ilman illuusiota ei voi kirjoittaa. Sen tarvitsee vain säilyttää johdonmukaisuus, joten sen täytyy vain heijastaa arvoa tässä mielessä vaatii Paradigman muutos.

Suurten mallien kehittämisestä puuttuu "supertuote"

JD.comin varapresidentti, dosentti ja tohtorinohjaaja Washingtonin yliopistossaHän XiaodongTekoälyn uskotaan kohtaavan kolme ongelmaa seuraavassa vaiheessa.

Ensinnäkin hän uskoo, että suurten mallien kehitys on tietyssä mielessä siirtynyt tasangolle.

Tietojen ja laskentatehon rajoituksista johtuen, jos parannukset perustuvat yksinkertaisesti mittakaavaan, katto voi saavuttaa ja laskentaresursseista tulee yhä raskaampi taakka. Jos viimeisintä hintasotaa (hintalappua) seurataan, on erittäin todennäköistä, että suurten mallien tuottama taloudellinen hyöty ei kata edes sähkölaskua, joten se on luonnollisesti kestämätöntä.

Toiseksi, professori He uskoo, että koko kaupallinen sovellus on jäljessä itse mallin mittakaavan kasvusta Keskipitkällä ja pitkällä aikavälillä tästä tulee lopulta ongelma:

Varsinkin kun näemme niin suuren mittakaavan, se ei ole enää vain tieteellinen ongelma, vaan siitä tulee myös tekninen ongelma. Esimerkiksi jos parametrit saavuttavat biljoonan tason, puhelutiedot saavuttavat 10 biljoonan merkkitason. Sitten on esitettävä kysymys: sen tuoma sosiaalinen arvo.

Tämän perusteella professori Hän uskoo, että tällä hetkelläSupersovelluksen ja supertuotteen puute, voi todella kuvastaa sijoituksen arvoa.

Kolmas kysymys on suhteellisen täsmällinen kysymys, nimittäinsuuri malli illuusio。

Jos haluamme rakentaa tekoälyteollisuusrakennuksen suurten mallien päälle, meillä on oltava erittäin korkeat vaatimukset suuren mallin perusilluusiolle. Jos suuren perusmallin virheprosentti on erittäin korkea, on vaikea kuvitella, että sen päälle voitaisiin lisätä kaupallisia sovelluksia.
Vakavien teollisten sovellusten on ratkaistava illuusio.

Professori Hän uskoo, että illuusion rajoitusten alla seuraava askel voi olla pohtia, miten mallin yleistymistä ja interaktiivisuutta voidaan laajentaa.multimodaalinenSe on väistämätön valinta.

Suurilta malleilta puuttuu tietoisuus "kykyrajoista"

Lenovo Groupin teknologiajohtaja, Euroopan tiedeakatemian ulkomainen akateemikkoRui YongTeollisuuden näkökulmasta hän esitti näkemyksensä tekoälyn seuraavasta vaiheesta.

Hän sanoi, että teollisesta näkökulmasta tärkeämpää on se, miten malli toteutetaan. Toteutuksen osalta tohtori Rui Yong puhui pääasiassa kahdesta asiasta:

Ei riitä, että meillä on suuri malli, sitä on kehitettäväagentti
Ei riitä, että sinulla on suuri pilvimittausmalli, sinulla on oltava ahybridikehys

Erityisesti tohtori Rui Yong listasi ensin joitakin tutkimuksia ja huomautti, että suurten mallien rajoitukset ovat tulossa yhä ilmeisemmiksi. Esimerkiksi alussa mainittu kysymys "kumpi on isompi, 13.8 vai 13.11" osoittaa, että malli ei oikein ymmärrä ongelmaa.

Hänen mukaansa nykyiset suuret mallit yhdistävät vain suuriulotteisessa semanttisessa avaruudessa nähdyn massiivisen hajanaisen informaation. Ei riitä, että rakennetaan suuria laskentatehoja suuria generatiivisia malleja älykkäiden agenttien kehittäminen.

Tohtori Rui Yong korosti erityisesti suurta malliaKykyjen rajakysymys.

Nykypäivän suuret mallit eivät itse asiassa tiedä, missä niiden kykyjen rajat ovat.
Miksi suurilla malleilla on hallusinaatioita ja miksi he puhuvat vakavaa hölynpölyä? Itse asiassa se ei yritä pettää meitä, mutta se ei tiedä mitä se tietää tai mitä se ei tiedä. Tämä on erittäin tärkeä asia, joten mielestäni ensimmäinen askel on saada agentti tuntemaan rajat sen kykyjä.

Lisäksi tohtori Rui Yong sanoi, että älykkyys ei yksin riitä tekoälyn toteuttamiseen, ja suuret julkiset pilvimallit on yksityistettävä yrityksille. Data- ja tietovetoiset muodostavat hybridi tekoälymallin, ja pienet mallit ovat myös erittäin hyödyllisiä monissa tilanteissa. On myös yksilökeskeisiä malleja, jotka voivat tietää henkilökohtaiset mieltymykset.

Se ei ole suuri kokonaan pilvitestaukseen perustuva malli, vaan suuri malli, jossa yhdistyvät hybridipääte ja pilvi.

uutiset