uutiset

shun xiangyangin young scientists 50² -foorumissa pitämän puheen koko teksti: 10 ajatusta suurista malleista

2024-09-28

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

28. syyskuuta 4. "young scientists 50² forum" pidettiin southern university of science and technologyssa. shen xiangyang, national academy of engineeringin ulkomainen akateemikko, piti pääpuheen aiheesta "kuinka meidän pitäisi ajatella suuria malleja insinöörissä. yleisen tekoälyn aikakausi" ja kertoi 10 ajatuksensa suurista malleista.

seuraavassa on hänen 10 ajatuksensa konkreettinen sisältö:

1. laskentateho on kynnys: suurten mallien laskentatehovaatimukset ovat olleet valtavat viimeisen 10 vuoden aikana. tänään aiomme tehdä suuren tekoälyn mallin sanomalla, että jumiutuminen satuttaa tunteita ja eston puute ei tarkoita tunteita.

2. data datasta: jos gpt-5 tulee ulos, datamäärä voi olla 200t. mutta internetissä ei ole niin paljon hyvää tietoa. tulee tarpeeseen.

3. suuren mallin seuraava luku: multimodaalista tieteellistä tutkimustyötä on tehtävänä. uskon, että erittäin tärkeä suunta on multimodaalisen ymmärryksen ja sukupolven yhdistäminen.

4. tekoälyn paradigman muutos: o1:n ilmestymisen jälkeen alkuperäinen gpt-esikoulutusidea vaihtui nykypäivän itsenäiseksi oppimispoluksi, joka on prosessi, jossa vahvistetaan oppimista päättelyvaiheessa ja jatkuvaa itseoppimista. koko prosessi on hyvin samanlainen kuin ihmisten ajattelu ja analysointi ongelmia, ja se vaatii myös paljon laskentatehoa.

5. suuret mallit pyyhkäisevät tuhansien teollisuudenalojen yli: kiinan suurten mallien rakentamisen aallossa teollisuudessa käytetään yhä enemmän suuria malleja. tämä trendi on ehdottomasti tällainen, ja yleisten suurten mallien osuus pienenee tulevaisuudessa.

6. ai agent, visiosta toteutukseen: supersovellus on olemassa alusta alkaen. tämä supersovellus on superassistentti ja superagentti.

7. avoin lähdekoodi vs. suljettu lähdekoodi: luulen, että meta's llama ei ole perinteinen avoin lähdekoodi. se vain avaa mallin eikä anna alkuperäistä koodia ja dataa. siksi meidän on myös muodostettava omat koodimme mielet todella ymmärtää kokonaiskuvan suljetun lähdekoodin työstä.

8. kiinnitä huomiota tekoälyn hallintaan: tekoälyllä on valtava vaikutus tuhansiin toimialoihin ja koko yhteiskuntaan, ja kaikkien on kohdattava se yhdessä.

9. ajattele uudelleen ihmisen ja tietokoneen suhdetta: vain ymmärtämällä todella ihmisen ja tietokoneen välistä vuorovaikutusta voimme tulla todella kaupallisesti arvokkaaksi johtajaksi jokaiselle korkean teknologian yritysten sukupolvelle. puhu nytopenaimicrosoftin lisääminen tarkoittaa, että tämä aikakausi on vielä edessä, mutta mielikuvitukselle on vielä paljon tilaa.

10. älykkyyden luonne: vaikka suuret mallit ovat järkyttäneet kaikkia, meillä ei ole teoriaa suurista malleista ja syvästä oppimisesta. noinaiongelman ilmaantumisesta vain puhuttiin, mutta sitä ei selitetty selkeästi.

"young scientists 50² forum" on new cornerstone science foundationin vuosittainen akateeminen kokous, jonka järjestääeteläinen tiede- ja teknologiayliopisto, tencent sustainable social value division ja new cornerstone science foundation järjestivät yhdessä. tencent perusti new cornerstone science foundationin ja sitä hallinnoi itsenäisesti 10 miljardin yuanin sijoituksella. se on tällä hetkellä yksi kiinan suurimmista julkisista hyvinvointisäätiöistä konkreettisia toimia tieteen rahoittamiseksi.

"young scientists 50² forum" on tieteidenvälinen akateeminen vaihtoalusta "scientific exploration award" -palkinnon voittajille. "scientific exploration award" perustettiin vuonna 2018. se on new cornerstone science foundationin rahoittama ja tiedemiesten johtama julkisen hyvinvoinnin palkinto. jokainen voittaja jakaa suuri ideansa ja uusimman tutkimustyönsä foorumilla vähintään kerran viiden vuoden rahoitusjakson aikana. "50²" tarkoittaa, että "scientific exploration award" -palkinnon vuosittain valitsemilla 50 nuorella tutkijalla on merkittävä vaikutus tieteellisiin ja teknologisiin läpimurtoihin seuraavien 50 vuoden aikana.

seuraavat ovatshen xiangyangpuheen koko teksti tällä foorumilla:

olen erittäin iloinen, että minulla on mahdollisuus jakaa kanssasi viimeaikainen oppiminen ja kokemus tekoälystä shenzhenissä tänään.

jatkanyao qizhitekoälyn aihe, josta herra sir puhui, haluan kertoa teille joistakin asioista, joita teemme nyt suurten mallien aikakaudella, erityisesti kun tarkastellaan tätä asiaa teknologian integraation ja teollisen siirtymän näkökulmasta.

itse asiassa se ei ole vain teknologisen kehityksen merkitys tekoälyn aikakaudella. koko ihmisen kehityksen historia on teknologian kehitystä ilman teknologiaa. emme katso taaksepäin asioita, kuten puun poraamista tulen sytyttämiseksi tai pyörän keksimistä – katsomme vain monia merkittäviä läpimurtoja fysiikassa viimeisen 100 vuoden aikana ja läpimurtoja tekoälyssä ja tietojenkäsittelyssä viimeisten 70 vuoden aikana. voimme nähdä, että kehitystä on ollut monia.

aihe, josta tänään puhumme, on tekoäly ja suuret mallit. muutaman viime vuoden aikana jokainen on järkyttynyt uudesta tekoälykokemuksesta askel askeleelta vaikka olisin työskennellyt tekoälyn parissa koko ikäni, olisi vaikea kuvitella nykyistä tilannetta muutama vuosi sitten.

haluan puhua kolmesta esimerkistä: ensimmäinen on luoda tekstiä tekstistä, toinen on luoda kuvia tekstistä ja kolmas on luoda video tekstistä. puhuimme juuri nyt chatgpt:n kaltaisesta tekoälyjärjestelmästä, joka on saatavilla paitsi kansainvälisesti myös kotimaassa. esimerkiksi ennen kuin tulin tänne pitämään puhetta, kysyin chatgpt:ltä, että aion osallistua tencent’s young scientists 50² -foorumiin ja pitää puheen, mistä aiheesta minun pitäisi puhua taustani vuoksi? saatat pitää sitä hieman hauskana, mutta itse asiassa sen käytön jälkeen luulet sen olevan erittäin hyvä.

kaikki tuntevat chatgpt:n kaksi vuotta sitten openai lanseerasi järjestelmän, joka luo kaavioita. se julkaisi seitsemän kuukautta sitten, että annat sille viestin, ja se luo sinulle 60 sekunnin teräväpiirtovideon, kuten tämän tokion kaduilla kävelevän videon. (en näytä videota ajanpuutteen vuoksi.)

annan sinulle esimerkin tästä vincenti-kaaviosta. olen pääaineena tietokonegrafiikka, ja mielestäni minulla on hyvä käsitys siitä, onko valokuva hyvä vai huono. tämä valokuva ilmestyi kaksi vuotta sitten. se oli ensimmäinen tekoälyn luoma valokuva ihmiskunnan historiassa, ja se ilmestyi amerikkalaisen muotilehden ("cosmopolitan") kannessa. digitaiteilija san franciscossa käytti openai-järjestelmää ja esitti kysymyksen, joka johti tähän tulokseen. tämä kohta on: valtavalla tähtitaivaalla naisastronautti käveli marsissa ja käveli kohti laajakulmaobjektiivia. minulla ei ole niin paljon taiteellista kykyä, mutta olin hyvin järkyttynyt, kun näin tämän kuvan, kun olet samaa mieltä kanssani. joten tämä tekoäly on saavuttanut erittäin älykkään tason.

nykyään meillä on niin uskomattomia tekniikoita ja jopa upeita tuotteita. työskentelemme myös kovasti kotona ja rakennamme suuria malleja tekniikasta tuleviin sovelluksiin. juuri nyt akateemikko yao puhui myös paljon tsinghuan yliopiston uusimmasta työstä. joten haluan kertoa teille, kuinka meidän pitäisi ajatella suuria malleja yleisen tekoälyn aikakaudella. haluaisin jakaa joitakin omia mielipiteitäni.

ensimmäinen ajatus on, että laskentateho on kynnys.

tärkeintä nykypäivän yleisessä tekoälyssä, suurissa malleissa ja syväoppimisessa on tekoälyn laskentatehon yleinen kasvu viime vuosina.

viimeisen 10 vuoden aikana suurten mallien laskentateho on kasvanut, aluksi kuusi-seitsemän kertaa vuodessa ja myöhemmin yli neljä kertaa vuodessa. saanen kysyä teiltä nyt kysymyksen, jos jokin kasvaa neljä kertaa vuodessa, kuinka monta kertaa se kasvaa 10 vuodessa? kun ajattelet sitä ensin, palaan tähän asiaan myöhemmin.

kaikki tietävät, että yritys, joka hyötyy eniten tästä tekoälyn kehityksen aallostanvidia, nvidian toimitukset kasvavat vuosi vuodelta, sen laskentateho kasvaa vähitellen, ja koko yrityksen markkina-arvosta on tullut yksi kolmesta maailman yrityksestä (microsoft, apple, nvidia), joiden markkina-arvo on 3 biljoonaa us$. tärkeintä on se, että jokainen tarvitsee laskentatehoa joka vuosi. vuonna 2024 ostettujen nvidia-sirujen määrä kasvaa edelleen nopeasti. esimerkiksi elon musk rakentaa 100 000 kortin klusteria verkkovaatimukset ovat erittäin korkeat.

tänään puhumme laskentatehosta ja suurista malleista. mitä enemmän laskentatehoa, sitä enemmän älykkyys kasvaa. valitettavasti koko datamäärän kasvaessa laskentatehon kasvu ei ole lineaarista kasvua, vaan laskentatehon kasvu on enemmän kuin neliön kasvu.

koska mallin kasvaessa datan määrää on lisättävä mallin kouluttamiseksi, joten suhteellisesti se on enemmän kuin neliökasvu. siksi laskentatehon vaatimukset ovat olleet valtavat viimeisen 10 vuoden aikana. sanon siis vain yhden asian: tänään aion tehdä suuren tekoälyn mallin, jos se on jumissa, jos se ei ole jumissa, sinulla ei ole tunteita.

esitin juuri kysymyksen, jos se nousee 4 kertaa vuodessa, kuinka monta kertaa se nousee 10 vuodessa? ne meistä, jotka opiskelevat tietokoneita, tietävät, että on olemassa jotain nimeltä "mooren laki", mikä tarkoittaa, että laskentateho kaksinkertaistuu noin 18 kuukauden välein. näin intel on kehittynyt vuosien varrella. miksi nvidia on nyt ohittanut intelin? erittäin tärkeä syy on, että sen kasvunopeus on erilainen. jos se kaksinkertaistuu 18 kuukaudessa, se kasvaa todennäköisesti 100 kertaa 10 vuodessa, mikä on myös erittäin merkittävää, jos se kasvaa 4 kertaa vuodessa, se on miljoona kertaa 10 vuodessa. jos ajattelee asiaa tällä tavalla, on ymmärrettävää, että nvidian markkina-arvo on noussut niin nopeasti viimeisen 10 vuoden aikana.

toinen ajatus koskee dataa.

laskentateho, algoritmit ja data ovat kolme tärkeää tekijää tekoälylle. mainitsin aiemmin, että tarvitsemme paljon dataa yleisen tekoälyn kouluttamiseen. kun chatgpt3 ilmestyi, se oli vielä julkaisuvaiheessa, ja sanottiin, että se tarvitsisi 2 biljoonaa token-dataa, kun gpt-4 ilmestyi, se olisi noin 12t, ja gpt-4 harjoittelee jatkuvasti nykyään sen määrän arvioidaan olevan yli 20 tonnia. jokainen tekoälystä kiinnostunut tietää, että kaikki ovat odottaneet gpt5:n ilmestymistä niin pitkään, mutta se ei ole tullut ulos . jälkeenpäin katsottuna internetissä ei ole niin paljon hyvää dataa, kun olet puhdistanut sen, 20t voi olla melkein huippu. joten tulevaisuudessa tarvitset olemassa olevien tietojen lisäksi enemmän multimodaalista tietoa, jopa keinotekoisesti syntetisoitua tietoa.

erittäin mielenkiintoinen asia on, että viimeisten kolmenkymmenen tai neljänkymmenen vuoden aikana kaikki ovat jakaneet tietojaan verkossa. aiemmin ajattelimme, että työskentelimme hakukoneiden hyväksi vuosi on hetken kuin chatgpt, se integroi kaiken ja oppi sellaisen tekoälymallin tehokkaan laskentatehon avulla.

kolmas ajatus, ison mallin seuraava luku.

olet työskennellyt tähän päivään asti, mitä sinun pitäisi tehdä seuraavaksi? ensimmäinen on kielimalli. chatgpt:n edustama sen taustalla oleva tekniikka on luonnollisen kielen käsittely. kaikki työskentelevät nykyään multimodaalisen mallin parissa, jota edustaa gpt-4, ja monet sen tekniikat ovat tietokonenäköä. eteenpäin meidän on kehitettävä ruumiillista älykkyyttä. mikä on ruumiillistuneen älyn tarkoitus? itse asiassa meidän on rakennettava maailmanmalli, vaikka se olisikin multimodaalinen, taustalla ei ole fyysistä mallia, joten meidän on rakennettava tällainen maailmanmalli. maailmanmalli tarkoittaa, että sinun ei tarvitse vain lukea tuhansia kirjoja, vaan myös matkustaa tuhansia kilometrejä syöttääksesi enemmän tietoa maailmasta takaisin aivoihisi. joten meidän pitäisi tehdä robotteja. mielestäni shenzhenin pitäisi päättää rakentaa robotteja ja ruumiillista älykkyyttä. roboteissa on erityinen rata nimeltä autonominen ajaminen. autonominen ajaminen on erityinen robotti, mutta se ajaa tiettyä reittiä.

mitä tehdä? multimodaalista tieteellistä tutkimustyötä on paljon tehtävänä, ja mielestäni erittäin tärkeä suunta on multimodaalisen ymmärryksen ja sukupolven yhdistäminen. vaikka sora rakennettaisiin, se on erillinen. monimoduulien sukupolvi ja monimoduulien ymmärtäminen eivät ole yhtenäisiä. tällä alalla voimme tehdä paljon tieteellistä tutkimustyötä.

esimerkiksi useat oppilaistani tekivät suuren malliyrityksen, step starsin, ja heidän multimodaalisen ymmärryksensä oli erittäin hyvä. jos näytät kuvan tekoälylle, miksi kuvassa olevaa käyttäytymistä kutsutaan "virheelliseksi taidoksi", tekoäly selittää sinulle, että kuva näyttää lapselta, joka pyörii maassa, mutta hänen äitinsä on välinpitämätön ja hän on katso matkapuhelimia ja juo juomia, joten tätä lasten taitoa kutsutaan virheelliseksi taidoksi. tekoäly ymmärtää nyt yhä paremmin kaavioita.

neljäs ajatus on tekoälyn paradigman muutos.

kaksi viikkoa sitten openai julkaisi uusimman mallinsa, o1. mainitsin aiemmin, että gpt5:tä ei ole julkaistu gpt4:n jälkeen. kaikki miettivät, onko se saavuttanut huippunsa. kukaan ei tiedä, sitä ei ole vielä julkaistu, emmekä ole tehneet suurempaa mallia kiinassa.

mutta nyt on ilmaantunut uusi ulottuvuus, joka ei ole edellisen esiharjoittelun (laajentamisen) tekeminen, vaan laajennuksen tekeminen päättelyä tehdessä. se on muuttunut alkuperäisestä gpt-ideasta nykypäivän itsenäiseksi oppimispoluksi, joka on prosessi, jossa vahvistetaan päättelyvaiheessa oppimista ja jatkuvaa itseoppimista.

aiemmin teimme esikoulutusta, periaatteessa ennustaen, mikä on seuraava sana ja mikä on seuraava merkki. nyt uusi idea on tehdä luonnos ja yrittää nähdä, onko tämä polku oikea ja oikea. aivan kuten ihmisen aivot ajattelussa on nopea ja hidas järjestelmä. aivan kuten tehdessämme matematiikan tehtäviä, teemme ensin luonnoksen nähdäksemme, mikä tapa toimii, ja sitten katsomme ajatteluketjun optimointiprosessin mahdollisuuksista. toistaiseksi vain openai on julkaissut tällaisen järjestelmän, ja kehotan kaikkia katsomaan joitain esimerkkejä täältä.

tärkeintä on, että koko prosessi on hyvin samanlainen kuin kuinka ihmiset ajattelevat ja analysoivat ongelmia, luonnostelevat, tarkistavat, korjaavat virheet ja aloittavat alusta. tämän tekeminen vaatii myös paljon laskentatehoa.

viides ajatus on, että suuret mallit pyyhkäisevät yli tuhansien toimialojen.

kaikki yritykset joutuvat kohtaamaan suurten mallien tuomat mahdollisuudet, mutta jokaisen yrityksen ei tarvitse tehdä universaalia isoa mallia iso malli mallissa tulee olla vähintään 10 000 korttia.

esimerkiksi kun gpt4 ilmestyi, sen harjoituksen kokonaismäärä oli 2×10^25 flopsia. näin suurella koulutusmäärällä kestää vuosi ajaa 10 000 a100-korttia, jotta tämä määrä saavutetaan. yleisellä suurella mallilla voimme rakentaa tältä pohjalta omia teollisuuden suuria malleja, kuten rahoitus ja vakuutus. ehkä kilokalorit pärjäävät hyvin, ja voimme tehdä siihen hienosäätöä. yritykselle sinulla on omat tiedot, mukaan lukien sisäiset tiedot ja asiakastiedot. jos otat nämä tiedot esiin ja käytät kymmeniä tai satoja kortteja, voit tehdä yrityksellesi erittäin hyvän mallin. joten se rakennetaan kerros kerrokselta.

tietysti on toinen erittäin tärkeä ulottuvuus, josta pidän kovasti, se on tulevaisuuden henkilökohtainen malli. nykyään olemme vähitellen käyttäneet tietokoneita ja matkapuhelimia (tietoja on kertynyt jossain määrin), ja ymmärrämme meitä enemmän ja enemmän. tulevaisuudessa uskon, että tällainen superälykäs tekoäly auttaa sinua keräämisen jälkeen tietoja, se voi rakentaa oman henkilökohtaisen mallisi. tämä on (henkilökohtaisessa) pääteosassa, ja matkapuhelimet ovat luonnollinen asia. pc-tietokoneiden osalta pc-yritykset, kuten microsoft ja lenovo, edistävät myös ai pc -konseptia, joten myös tällaisia ​​mahdollisuuksia on.

kiinan suurten mallien rakentamisen aaltoon sisältyy yhä enemmän teollisuuden suuria malleja. tässä on esimerkki, koska kiinan kyberavaruushallinnon on hyväksyttävä kiinan suuret mallit ennen kuin ne tulevat verkkoon, tämän vuoden heinäkuun loppuun mennessä kiinan kyberavaruushallinto oli hyväksynyt yhteensä 197 mallia. joista 70 % oli alan suuria malleja ja 30 % yleisiä suuria malleja. tämä trendi on ehdottomasti tällainen, ja yleisten suurten mallien osuus pienenee tulevaisuudessa. voimme esimerkiksi tehdä talousmallin yleisellä suurella mallilla. tämä on shanghailaisen yrityksen talousasiakkailleen valmistama suuri malli. kun esimerkiksi nvidian talousraportti ilmestyy, voit tehdä heti yhteenvedon sen kohokohdista ja ongelmista.

kuudes ajatus on ai agent, visiosta toteutukseen.

tänään näemme, mitkä ovat suurten mallien suurimmat supersovellukset ja missä ovat suurimmat mahdollisuudet. monet ihmiset yrittävät edelleen löytää supersovellusta. itse asiassa supersovellus on ollut olemassa alusta asti tämä supersovellus on superassistentti, superagentti.

gates ja minä työskentelimme yhdessä microsoftilla useita vuosia, ja mietimme molemmat tätä asiaa. mikä siinä on niin vaikeaa? vaikeus on ymmärtää työnkulkua, kun todella haluat tehdä hyödyllistä työtä. jos esität kysymyksen, se voidaan jakaa askel askeleelta. nykyään voin tehdä jotain, jolla on jonkin verran vaikutusvaltaa, kuten asiakaspalveluna tai henkilökohtaisena avustajana. mutta monia töitä ei voida tehdä, miksi sitä ei voida tehdä? sinun täytyy olla digitaalinen aivo. alla oleva suuri malli on vain ensimmäinen askel suuren mallin kyky ei ole tarpeeksi tehokas auttamaan sinua suorittamaan kaikkia yllä olevia asioita askel askeleelta. koska haluat todella tehdä sellaisen agentin, jotta se voi tehdä asioita, sen on ymmärrettävä, mitä seuraavat ongelmat ovat, ja jokaisella osalla on vastaavat taidot.

olemme jo tehneet monia hyviä esimerkkejä tämän päivän mallista. voit esimerkiksi olla tekoälyn terveyskonsultti, puhua ymmärryksestäsi kosmetiikasta ja suositella kosmetiikkaa.

seitsemäs ajatus on avoin lähdekoodi ja suljettu lähdekoodi.

maailman tieteen ja teknologian kehityksessä viime vuosikymmeninä, erityisesti kiinan tieteen ja teknologian kehityksessä, kaksi asiaa ovat erittäin tärkeitä.

ensimmäinen on internetin syntyminen internetin avulla löydät kaikki paperit ja materiaalit verkosta.

toinen on avoin lähdekoodi. mutta avoin lähdekoodi ei ole sama asia kuin avoin lähdekoodi suurille malleille ja tietokantoille, vaikka avoimen lähdekoodin ominaisuudet ovat nyt lähellä suljetun lähdekoodin ominaisuuksia. kiinassa on myös monia yrityksiä, jotka tekevät avoimen lähdekoodin asioita. nykyään paras avoimen lähdekoodin työkalu on meta's llama 3.1, joka väittää olevansa lähellä openai:ta. en usko, että se ei ole perinteinen avoimen lähdekoodin se vain avaa mallia eikä anna sinulle alkuperäistä koodia ja tietoja. siksi meidän on myös päätettävä todella ymmärtää suurten mallien järjestelmän sulkeminen.

kahdeksas ajatus on kiinnittää huomiota tekoälyn hallintaan.

koska tekoäly kehittyy niin nopeasti, maailma pitää tekoälyn turvallisuutta erittäin tärkeänä. koska tämän asian vaikutus on niin suuri. tekoälyllä on valtava vaikutus tuhansiin toimialoihin ja koko yhteiskuntaan.

yhdeksäs ajatus on ajatella uudelleen ihmisen ja koneen suhdetta.

esittelin juuri vincentin tekstin, vincentin kuvat ja vincentin videon – kuinka suuri osa siitä on koneen älykkyyttä ja kuinka paljon se on shokki, jonka ihmisen ja tietokoneen välinen vuorovaikutus tuo meille?

noin 10 vuotta sitten "new york timesin" kolumnisti john markoff kirjoitti kirjan, josta pidän kovasti, "machine of loving grace", joka tiivisti tekniikan menneisyyden kaksi linjaa: toinen on tekoäly, toinen on ia; älykäs lisäys), se on älykkyyden parantamista, joka on ihmisen ja tietokoneen välistä vuorovaikutusta. kun tietokoneet tulivat saataville, ne auttoivat ihmisiä tekemään monia asioita, ja shakin pelaaminen on yksi esimerkki.

itse asiassa vain ymmärtämällä todella ihmisen ja tietokoneen vuorovaikutusta meistä voi tulla johtajia, joilla on todellista kaupallista arvoa jokaiselle korkean teknologian yritysten sukupolvelle. tämän päivän tekoälyn käyttöliittymä on tullut hyvin selväksi, mikä on vuoropuheluprosessi. tämän päivän edustaja on chatgpt. mutta openai:sta ja microsoftista puhuminen tarkoittaa, että tämä aikakausi on vielä edessä, mutta mielikuvitukselle on vielä paljon tilaa.

kymmenes ajatus on älyn luonne.

vaikka suuret mallit ovat järkyttäneet kaikkia nykyään, meillä ei ole teoriaa suurista malleista ja syvästä oppimisesta. tänään haluaisimme minkä tahansa teorian, joka tuntuu hyvältä. toisin kuin fysiikassa, fysikaalisesta näkökulmasta katsottuna kaikki valtavasta tähtitaivasta pienimpään kvanttiin kuvataan kauniilla fysikaalisilla laeilla. nykyään ei ole olemassa sellaista tekoälyn teoriaa, jolla ei ole selitettävyyttä tai kestävyyttä. nykypäivän syväoppimiskehys ei voi saavuttaa todellista yleistä tekoälyä.

tekoälyn syntymisestä kaikki vain puhuivat, mutta eivät selittäneet sitä selkeästi. miksi älykkyyttä syntyy, kun malli on tarpeeksi suuri? miksi 70b-malli voi ilmaantua älykkäästi? sellaista totuutta ei ole olemassa. teemme siis myös kovasti töitä tämän asian parissa. viime kesänä järjestin myös seminaarin hongkongin tiede- ja teknologiayliopistossa teemalla "matemaattinen teoria nousevalle älylle". tutkia osallistumistarpeita. tule mukaan, varsinkin tencentin "science exploration award"- ja "new cornerstone researcher" -projektien myötä, enemmän nuoria tutkijoita on liittynyt, ja heillä on enemmän luottamusta ja uskoa mennä syvälle vaikeaan tehtävään. läpimurtoja tekoälyn tulevalle kehitykselle.

onnittelut vielä kerran kaikille voittajille ja nuorille tutkijoille. tieteen ja teknologian kehittäminen on tehtävä nuorten sukupolvelta toiselle, erityisesti tekoäly. kiitos vielä kerran.