tulkinta｜ xiao yanghua: millaisen vaikutuksen o1-mallilla on tohtoritason matemaattisilla kyvyillä?

2024-09-13

· asiantuntijatason päättelykyky ei ole kysymys ja vastaus -taktiikka, se vaatii vahvaa ajattelukykyä. suurien mallipäättelykykyjen harjoittamisen vaikeus on se, että suuri määrä ihmisen ajatteluprosesseja ei koskaan ilmene, joten ajatteluprosessista on äärimmäisen niukasti tietoa.

· ihmisten on yhä vaikeampaa saavuttaa tekoälyn kehitysvauhtia. ihmiset ovat niitä, jotka avaavat tekoälyn taikuuden kykyjä, on todennäköistä, että tulee aikoja, jolloin ihmiset eivät pysty aktivoimaan sen supervoimia, koska ne ovat ihmisen kognition tason ulkopuolella.

openai:n julkaisemassa uudessa mallissa o1 on tehokkaat päättelyominaisuudet. visuaalinen kiinan kartta

syyskuun 12. päivänä, paikallista aikaa, openai lanseerasi uuden sukupolven mallisarjan o1 verrattuna aikaisempiin malleihin, tämä malli on osoittanut vahvaa päättelykykyä ja suoriutunut yhtä hyvin jatko-opiskelijoille fysiikan, kemian ja biologian vertailutehtävissä tämä ominaisuus on jotain, jota aiemmissa malleissa ei ollut.

13. syyskuuta xiao yanghua, fudanin yliopiston tietojenkäsittelytieteen ja teknologian korkeakoulun professori ja tohtorinohjaaja sekä shanghain tietotieteen keskeisen laboratorion johtaja, sanoi the paper -lehden haastattelussa, että o1-mallin ilmaantuminen tarkoittaa, että suurten mallien päättelykyky voi saavuttaa täysin asiantuntijatason. sitä voidaan pitää tekoälyn virstanpylväsnä, joka parantaa huomattavasti mallien soveltamista yrityspuolella.

mutta hän myönsi myös, että mallin älyllisten, havainnointikykyjen ja rationaalisten kykyjen parantuessa se ylittää ihmisen kyvyt on vaikea ennustaa, mikä vaikutus tekoälyllä on ihmisiin tulevaisuudessa kehitys ylittää nyt nopeuden, jonka ihminen ymmärtää siitä, ja tekoälyn hallinta tulee olemaan valtava haaste", xiao yanghua sanoi.

hyvä perustelemaan monimutkaisia tehtäviä, suoritus vastaa tohtorintutkintoa.

varhaisena mallina uudessa johtopäätösmallissa o1 ei vielä täysin ole chatgpt:n käyttämiä toimintoja, kuten verkkotietojen selailu, tiedostojen ja kuvien lataaminen jne. mutta openai sanoi, että tämä on merkittävä parannus monimutkaisiin päättelytehtäviin ja edustaa uutta tekoälykyvyn tasoa.

"koulutuksen avulla he oppivat tarkentamaan ajatteluprosessejaan, kokeilemaan erilaisia strategioita ja tunnistamaan virheensä laajamittaiset vahvistusoppimisalgoritmit opettavat malleja ajattelemaan tehokkaasti käyttämällä ajatusketjujaan koulutusprosessin aikana, ja o1-malli osaa ajatella ennen." vastaaminen käyttäjälle luo pitkä sisäinen ajatusketju. enemmän vahvistusta oppimista ja enemmän aikaa ajatella, o1:n suorituskyky paranee edelleen. se oppii jakamaan hankalat vaiheet yksinkertaisempiin. kun nykyinen menetelmä ei toimi, se yrittää toista lähestymistapaa.

uusi päättelymalli o1 loistaa matematiikassa ja ohjelmoinnissa, loistaen monimutkaisen koodin tarkassa luomisessa ja virheenkorjauksessa. openai arvioi mallin matemaattisen suorituskyvyn aime:ssä (american mathematics invitational competition). %(11,1/15). kansainvälisen matemaattisten olympialaisten (imo) karsintakokeessa gpt-4o ratkaisi vain 13 % ongelmista oikein, kun taas uusi päättelymalli sai 83 %.

uusi malli voi pohtia monimutkaisia tehtäviä ja suorittaa tohtoriopiskelijan tavoin fysiikan, kemian ja biologian benchmark-tehtäviä. openai teki gpqa-timanttitestejä kemiassa, fysiikassa ja biologiassa. mallin vertaamiseksi ihmisiin rekrytoitiin tohtorintutkinnon suorittaneita asiantuntijoita vastaamaan kysymyksiin yhdessä.

"huomasimme, että o1 suoriutui ihmisasiantuntijoita paremmin, ja siitä tuli ensimmäinen malli, joka teki niin tällä vertailuarvolla. nämä tulokset eivät tarkoita, että o1 olisi kaikilta osin pätevämpi kuin tohtorit, vain sitä, että malli on parempi ratkaisemaan tohtorintutkintotarpeita terveydenhuollon tutkijat voivat käyttää o1:tä solusekvenssitietojen merkitsemiseen, fyysikot voivat käyttää o1:tä kvanttioptiikassa tarvittavien monimutkaisten matemaattisten kaavojen luomiseen, ja kehittäjät voivat käyttää sitä kaikilla aloilla, openai sanoi.

virstanpylväiden päättelyominaisuudet parantavat huomattavasti sovellustehosteita

"edellinen iso kielimalli oli enemmän taiteiden opiskelija ja on vielä kaukana luonnontieteiden opiskelijan tasosta. ihmisen älykkyyden ydinkyky on kuitenkin ajattelu ja ajattelu. openai:n uusi päättelymalli o1 -sarja näyttää ihmisen ajatteluprosessin. "xiao yanghua sanoi: uuden päättelymallin o1 olemus on edelleen suuri kielimalli, mutta se hyödyntää täysin suuren mallin potentiaalia. aikaisemmin suurten mallien sukupolvikyvyn määritti korpus, joka oli kuin "kolisataa tang-runoa tuttu, ja niitä voi lausua, vaikka ei osaisi säveltää." asiantuntijatason päättelykyky ei kuitenkaan ole kysymys ja vastaus -taktiikka, se vaatii vahvaa ajattelukykyä. suurien mallipäättelykykyjen harjoittamisen vaikeus on se, että suuri määrä ihmisen ajatteluprosesseja ei koskaan ilmene, joten ajatteluprosessista on äärimmäisen niukasti tietoa.

"openai:lla on selvä ensisijainen etu. sen perusmalli on vahvempi, se kerää paljon ajatteluprosessidataa, seuloa ja syntetisoi suuren määrän laadukasta ajattelutietoa ja sillä on vahvat arviointimahdollisuudet. mitkä päättelyprosessit ovat oikein ja mitkä päättelyprosessit se on väärin, mikä vaatii vahvistusoppimisen käyttöä. vahvistusoppiminen on pohjimmiltaan tutkimus- ja kokeiluprosessi, jos se ei toimi, kokeile vain toista menetelmää." xiao yanghua sanoi sen näiden teknologioiden ja tietojen ansiosta openai on tehnyt suuresta mallista todellisen luonnontieteiden opiskelijan siinä mielessä, että se saavuttaa asiantuntijatason.

chen yunwen, daguan datan puheenjohtaja, sanoi, että aiemmat mallit eivät pystyneet laskemaan monimutkaisia edistyneitä matemaattisia ongelmia, ja o1 on parantanut matemaattisia ja päättelykykyjä, mikä on suuri parannus. matemaattisten valmiuksien parantaminen ei kuitenkaan tarkoita sitä, että suurten mallien t&k-paradigmassa olisi tapahtunut olennaisia muutoksia, vaan se on vain suunnannut parannuksia aikaisempiin puutteisiin.

xiao yanghuan näkemyksen mukaan o1:n ilmestyminen ei ollut odottamatonta. ”itse asiassa arvioimme jo hyvin varhain, että suurilla malleilla on vahvempia tunne- ja rationaalisia kykyjä täällä, ja vaikutus on niin hämmästyttävä.” hän uskoo, että tulevaisuudessa openai voi erottua moniksi suuriksi malleiksi, jotka ovat hyviä tekemään erilaisia asioita yleisen suuren mallin perusteella.

esimerkiksi gpt-4:n aiemmat versiot tunsivat kaiken tiedon ja tosiasiat, ja gpt-4o painotti multimodaalista vuorovaikutusta ja o1-sarja painotti ajattelua ja rationaalisia kykyjä. mallin rationaalisuuden parantaminen mahdollistaa to b -toimialan käynnistävän valtavan kehityksen. "to b:n suurin kipu ja pullonkaula piilee suurten mallien päättelykyvyssä. uuden johtopäätösmallin o1-sarjan ilmaantuminen tarkoittaa, että monet to b -toimialan ongelmat voidaan tulevaisuudessa lievittää huomattavasti."

tekoälyn nopean kehityksen tuomat haasteet

"openai on todella voimakas. vaikka openai:n tekninen tiekartta ei ole toistaiseksi ylittänyt kognition rajoja, me kaikki tiedämme suurten mallien kehityssuunnan, mukaan lukien multimodaalisuus ja parannetut päättelykyvyt, mutta vain openai on nopeasti muuttanut sen todeksi. he kouluttavat suuria malleja aivan samalla tavalla kuin ihmiset heillä on erittäin vahvat käsitykset ihmisen älyllisestä kehityksestä ja evoluutiosta. "selitä.

openai:lla on ilmeisiä etuja suurten kotimaisten mallien kehittämisessä: "openai:n edut ovat meille kaikki haittoja. meidän täytyy rauhoittua ja saada kiinni hitaasti. yleisellä tekoälyllä on vain ensimmäinen, ei toinen. ." pitkällä aikavälillä xiao yanghua sanoi kuitenkin, että suurten mallien yksittäisten ominaisuuksien parantamiselle on olemassa katto. koska ihmisen todellinen alkuperäinen data on rajallinen ja tuotantonopeus hidas. "tällä hetkellä openai käyttää ihmisdataa syntetisoimaan uutta dataa parantaakseen päättelykykyä. synteettistä dataa kuitenkin rajoittaa alkuperäinen data. se ei voi syntetisoida loputonta dataa, eikä se voi saada olennaisesti uutta dataa. se ei voi tämän vuoksi keksiä uusia aiheita. ehdota uusi teoria, kuten einstein "laitteiston kannalta päättely vaatii vähemmän laskentatehoa kuin koulutus, mutta ajatteluketjun pidentymisen vuoksi päättelyn tehokkuuden vaatimukset ovat korkeammat, mikä asettaa korkeampia vaatimuksia kiihtyvyydelle ja optimoinnille. päättelyprosessi.

suuret mallit ovat kuitenkin monilta osin parantuneet, ja ne ovat tuoneet haasteita johtamiseen haasteena on, että ihmisten ymmärtäminen niistä ei ole parantunut yhtä nopeasti kuin se on kehittynyt.

filosofi kant jakoi ihmisen kognitiivisen prosessin kolmeen vaiheeseen: havainnolliseen, älylliseen ja rationaaliseen. nykyään suurten mallien herkkyys, älykkyys ja rationaalisuus paranevat ja ylittävät todennäköisesti ihmiset. hyvin harvat ihmiset voivat olla vahvoja näissä kolmessa kognitiossa.

"tällä hetkellä o1 on saavuttanut jatko-opiskelijan tason. tulevaisuudessa tiedemiehen tason saavuttaminen on vain prosessi määrällisten muutosten saavuttamiseksi. ihminen putoaa vähitellen tekoälyn kehityksen kognitiiviseen sokeaan kulmaan. esimerkiksi mitä tarkoittaa suurten mallien nykyinen päättelykyky. voiko sitä todella käyttää tietotason yläpuolella olevien ihmisten osuus vain pienenee ja pienenee. matematiikan, fysiikan, kemian tai matematiikan taso. kuinka monet meistä ymmärtävät, tunnistavat ja hallitsevat tekoälyä "xiao yanghua sanoi, että ihmiset ovat tällä hetkellä tohtorin tasolla. aiheet, kuten työllisyys, talous, etiikka ja sosiaaliset suhteet, herättävät laajaa keskustelua "ihminen on tekoälyn taikuuden estäjiä. jos tekoälyllä on yli-inhimillisiä kykyjä, ne ovat todennäköisesti supervoimia, joita ihmiset eivät voi aktivoida. ovat ihmisen kognition tason yläpuolella."

paperin toimittaja zhang jing

(tämä artikkeli on the paperista. jos haluat lisätietoja, lataa "the paper" -sovellus)

raportti/palaute

uutiset

tulkinta｜ xiao yanghua: millaisen vaikutuksen o1-mallilla on tohtoritason matemaattisilla kyvyillä?

johdanto

yhteystietoni