uutiset

raskasta! laajamittainen openai-päättelymalli, joka voi "ajatella ongelmanratkaisulogiikkaa", on näyttämöllä, ja kognitio hyppää "tieteen tohtoriopiskelijan tasolle"

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

noin kello 1 perjantaina pekingin aikaa ai-aikakausi avasi uuden lähtökohdan – suuret mallit, jotka pystyivät yleiseen ja monimutkaiseen päättelyyn, nousivat vihdoin etualalle.

kuvan lähde: visual china-vcg31n2008743681

openai ilmoitti virallisilla verkkosivuillaan, ettäaloitti openai o1 -esikatselumallin levittämisen kaikille tilaajille - laajalti odotetun "strawberry" -suuren mallin. openai totesi, että monimutkaisissa päättelytehtävissäuusi malli edustaa uutta tekoälykyvyn tasoa, joten kannattaa nollata luku 1:ksi ja antaa sille uusi nimi, joka eroaa "gpt-4"-sarjasta.

suurten päättelymallien ominaisuudet ovatai viettää enemmän aikaa miettimiseen ennen vastaamista, aivan kuten ihmiset ajattelevat ongelmanratkaisuprosessia. aikaisempien suurten mallien logiikka oli ennustaa sananmuodostusjärjestystä oppimalla kuvioita suuressa määrässä tietojoukkoja. tarkkaan ottaen he eivät ymmärtäneet kysymystä.

o1-sarjan mallin ensimmäisenä versiona openai julkaisi vain o1-preview-esikatseluversion ja o1-mini-miniversion, ja se lanseerattiin vaiheittain maksaville käyttäjille, ilmaisille käyttäjille ja kehittäjille, ja hinta on kehittäjille melko kallis. .

o1-mallin käyttökustannukset ovat vähintään 3 kertaa gpt-4o:n käyttökustannukset. se on koulutettu uudella menetelmällä.

raporttien mukaan o1:n uusi malli voi vastata monimutkaisempiin ohjelmointiin, matematiikkaan ja tieteellisiin ongelmiin sen takana olevan uuden koulutusmenetelmän kautta. se "ajattelee" ennen vastauksen antamista ja on nopeampi kuin ihmiset. pienempi, halvempi miniversio keskittyy ohjelmoinnin käyttötapauksiin.

chatgpt plus- ja team-maksullisilla käyttäjillä on välitön pääsy molempiin malleihin, ja he valitsevat ne manuaalisesti käyttöliittymän ai-mallivalitsimen pudotusvalikosta. molemmat tilat ovat chatgpt enterprisen ja edun käyttäjien saatavilla ensi viikolla, ja o1-mini on kaikkien ilmaisten käyttäjien saatavilla tuntemattomaan aikaan tulevaisuudessa. openai toivoo tulevaisuudessa automaattisesti valitsevansa oikean mallin kehotteiden perusteella.

kehittäjän pääsy o1:een on kuitenkin erittäin kallista api:ssa (application programming interface) o1-esikatselu veloittaa 15 dollaria 1 miljoonasta syöttötunnisteesta, joka on kolme kertaa gpt-4o:n hinta ja 60 dollaria miljoonalta lähtötunnisteelta neljä kertaa gpt-4o:n kustannukset. miljoona merkkiä on mallin jäsentämän tekstilohkon koko, mikä vastaa noin 750 000 sanaa.

openai:n tutkimuspäällikkö jerry tworek kertoi medialle,o1sen takana oleva koulutusmenetelmä eroaa olennaisesti aiemmista malleista.

ensin o1:tä "koulutettiin käyttämällä täysin uutta optimointialgoritmia ja uutta, erityisesti sitä varten räätälöityä koulutustietosarjaa", joka sisälsi "päätelmädataa" ja sitä varten räätälöityä tieteellistä kirjallisuutta.

toiseksi, edellinen gpt-mallin koulutusmenetelmä oli jäljitellä tietojoukon sääntöjä/paradigmoja, kun taas o1 käyttää "vahvistusoppimista" opettaakseen mallia ratkaisemaan ongelmia itsenäisesti palkkioiden ja rangaistusten kautta ja sitten "ideaketjun" kautta. " (ideaketju) ajatuksia) käsittelemään käyttäjän kyselyongelmia ja antamaan tiivistelmän ajatusketjusta, samalla tavalla kuin ihmiset käsittelevät ongelmia askel askeleelta.

oikeanpuoleisessa kuvassa voit klikata ideaketjua nähdäksesi miten o1-malli "ajattelee"

kaavio, joka näyttää ideaketjun monimutkaiselle matemaattiselle ongelmalle

openai uskoo, että tämä uusi koulutusmenetelmä tekee o1-mallista tarkemman ja vähentää vastausten keksimiseen liittyvää "hallusinaatiota", mutta se ei voi täysin eliminoida "hallusinaatioiden" esiintymistä. suurin ero uuden mallin ja gpt-4o:n välillä on, että se pystyy paremmin ratkaisemaan monimutkaisia ​​ongelmia, kuten ohjelmoinnin ja matematiikan, samalla kun se parantaa päättelyprosessiaan, kokeilee erilaisia ​​strategioita sekä tunnistaa ja korjaa omissa vastauksissaan olevat virheet.

kognitio hyppää "tieteen tohtoriopiskelijan tasolle"

openai on selittänyt, että vuonna 2023 julkaistu gpt-4 on samanlainen kuin lukiolaisten älykkyystaso, kun taas gpt-5 täydentää tekoälyn kasvua "lukiolaisista tohtoriksi". tämä o1-malli on tärkeä askel.

verrattuna olemassa oleviin suuriin malleihin, kuten gpt-4o, openai o1 voi ratkaista vaikeampia päättelyongelmia ja parantaa aiempien mallien mekaanisia virheitä.

esimerkiksi uusi malli osaa laskea kuinka monta "r":tä mansikassa on.

samaan aikaan tekoäly on organisoituneempi vastattaessa ohjelmointikysymyksiin.ennen kuin aloitat koodin kirjoittamisen, mieti koko vastausprosessi läpi., ja tulosta sitten koodi.

esimerkiksi runonkirjoitustehtävässä esiasetetuilla ehdoilla (esim. toisen virkkeen viimeisen sanan tulee päättyä i:llä) gpt-4o, joka "ottaa kynän ja kirjoittaa", antaa vastauksen, mutta usein vain osa ehdoista täyttyy. se ei myöskään korjaa itseään. tämä tarkoittaa, että tekoälyn on kohdattava oikea vastaus ensimmäisen kerran, kun se luodaan, muuten se tekee virheitä. mutta o1-mallissa tekoäly jatkaa yritys- ja erehdystä ja hiotaan vastauksiaan, mikä parantaa merkittävästi luotujen tulosten tarkkuutta ja laatua.

mielenkiintoista on, että kun napsautat tekoälyn ajatteluprosessia, tekoäly tulee myös näkyviin sanoen "ajattelen tätä, onko hyvä tehdä tämä?", "voi, minulla ei ole tarpeeksi aikaa, minä on annettava vastaus mahdollisimman pian” jne. openai vahvisti, että se, mitä tässä näytetään, ei ole alkuperäinen ajatusketju, vaan "mallin luoma yhteenveto", ja yritys myönsi myös suoraan, että "kilpailuedun" ylläpitämiseen on olemassa tekijöitä.

openai:n tutkimuspäällikkö jerry tworek paljasti, että o1-mallin takana oleva koulutus eroaa olennaisesti aiemmista tuotteista.aiemmat gpt-mallit suunniteltiin jäljittelemään kuvioita harjoitustiedoissaan, kun taas o1 koulutettiin ratkaisemaan ongelmia yksinään. vahvistusoppimisen prosessissa palkitsemis- ja rangaistusmekanismeja käytetään "kouluttamaan" tekoälyä käyttämään "ajatteluketjuja" käsittelemään ongelmia, aivan kuten ihmiset oppivat purkamaan ja analysoimaan ongelmia.

testin mukaano1-malli pystyi saavuttamaan 83 % kansainvälisen matematiikan olympialaisten karsintakokeesta, kun taas gpt-4o pystyi ratkaisemaan vain 13 % ongelmista oikein.ohjelmointikykykilpailussa codeforces o1-malli sai 89 %, kun taas gpt-4o vain 11 %.

openai sanoi, että testauksen perusteella seuraavassa päivitetyssä versiossatekoäly voi suorittaa phd-tason haastavissa fysiikan, kemian ja biologian mittareissa

haitat: ei pysty selaamaan reaaliaikaisia ​​verkkosivuja, ei pysty lataamaan tiedostoja ja kuvia, laajan maailmantiedon puute tai altis hallusinaatioille

mutta o1-mallin alkuperäisenä versiona tänään julkaistussa o1-esikatseluversiossa on myös ilmeisiä puutteita. se on esimerkiksi vain "tekstiversio", joka ei voi tilapäisesti selata verkkotietoja ja ladata tiedostoja ja kuvia, mikä tarkoittaa, että siinä ei ole monia chatgpt:n toimintoja. se ei ole yhtä tehokas kuin gpt-4o käyttötapauksia ja käyttörajoituksia, o1-esikatseluversiossa on 30 viestiä viikoittain ja miniversiossa 50 viestiä.

muita mainittuja rajoituksia ovat: o1-malli ei ole yhtä tehokas kuin gpt-4o monilla alueilla, ja se toimii huonosti tosiasiallisen tietämyksen suhteen vain puhdas tekstimalli, josta puuttuu kyky perustella tiettyjä asiakirjoja tai kerätä reaaliaikaista tietoa verkosta.

lisäksi tekoälymallin tic-tac-toe-pelaamista on aina pidetty alan ongelmana. uusi päättelykykyinen o1-malli tekee edelleen virheitä tässä pelissä, eli se ei voi täysin voittaa teknisiä vaikeuksia. .

openai myönsi myös teknisessä asiakirjassa, että se oli saanut "anekdoottista palautetta", että o1-esikatselu ja miniversio tuottivat todennäköisemmin "illuusioita" kuin gpt-4o ja sen miniversio, eli tekoäly oli edelleen erittäin keksiä vastauksia, ja o1 harvoin myöntää, ettei se tiedä vastausta kysymykseen.

tunnettu teknologiamedia techcrunch huomautti, että openai huomautti o1-malliin liittyvässä blogikirjoituksessa, että se päätti olla näyttämättä käyttäjille tämän uuden mallin alkuperäistä "ajatteluketjua", vaan päätti antaa yhteenvedon ajatteluketju vastauksessa tavoitteena on säilyttää "kilpailuetu" ja kompensoida mahdolliset puutteet, "pyrimme opettamaan mallin toistamaan vastauksissaan kaikki hyödylliset ideat ajatusketjussa."

päivittäiset talousuutiset kattavat julkiset tiedot

päivittäisiä talousuutisia

raportti/palaute