hidasta ja kallista? openai-päätelmämalli "strawberry" on täällä, kuinka pitkällä on gpt-5?

hidasta ja kallista? openai-päätelmämalli "strawberry" on täällä, kuinka kaukana on gpt-5?

2024-09-13

openai:n "strawberry" on vihdoin täällä.

syyskuun 12. päivänä paikallista aikaa tekoälyjätti openai julkaisi openai o1 -sarjan tekoälyn päättelymalleja koodinimeltään "strawberry", mukaan lukien openai o1-esikatselu ja pieni versio o1-ministä.

openai:n mukaan o1 viettää enemmän aikaa ongelmien pohtimiseen ennen reagoimista, aivan kuten ihmiset. koulutuksen kautta opin tarkentamaan ajatteluprosessiani, kokeilemaan erilaisia strategioita ja tunnistamaan virheeni. perustele monimutkaisia tehtäviä ja ratkaise vaikeampia ongelmia kuin aiemmat tieteelliset, koodaus- ja matemaattiset mallit.

openai totesi, että tämä mallisarja on suuri edistysaskel monimutkaisissa päättelytehtävissä, joten se myös nollaa tuotelaskurin arvoon 1 ja nimesi sen openai o1:ksi. nimessä oleva "o" voi viitata orioniin.

vahvempi päättelykyky, ajatteluketju tarjoaa uusia mahdollisuuksia malliturvallisuuteen

"strawberry"-projektia kutsuttiin aiemmin nimellä "q*", mikä oli syy, joka laukaisi openai:n "oikeustaistelun" ja johti yhtiön toimitusjohtajan sam altmanin äkilliseen erottamiseen. openai:n teknologiajohtaja mira murati kertoi tuolloin työntekijöille, että q* (lausutaan q-star) tekoälyn läpimurtoa koskeva kirje sai lähteiden mukaan hallituksen ryhtymään ampumiseen.

openai:n edistyminen q*:ssa on saanut jotkin yrityksen sisäpiiriläiset uskomaan, että tämä saattaa olla heidän läpimurtonsa "superälyn (agi, keinotekoinen yleinen äly) löytämisessä".

virallisten tietojen mukaan o1:llä on monia ominaisuuksia, jotka ylittävät huomattavasti gpt-4o:n ominaisuudet. sijalla 89 codeforcesissa, sijoittui maan 500 parhaan opiskelijan joukkoon american mathematical olympiadissa (aime) ja ylitti human tohtoritason.

raporttien mukaan, samoin kuin ihmiset saattavat ajatella pitkään ennen kuin vastataan vaikeaan ongelmaan, o1 käyttää myös ajatuksia, kun yrittää ratkaista ongelman. vahvistusoppimisen avulla o1 voi oppia hiomaan ajatteluketjuaan ja parantamaan käyttämiään strategioita. se oppii tunnistamaan ja korjaamaan virheet, jakamaan hankalat askeleet yksinkertaisemmiksi ja kokeilemaan erilaisia lähestymistapoja, kun nykyinen ei toimi.

openai sanoi, että ajatusketjujen käyttäminen voi parantaa merkittävästi turvallisuutta ja johdonmukaisuutta, koska mallin ajattelu voidaan havaita selkeästi ja mallin perustelut turvallisuussäännöistä ovat vahvempia jakelun ulkopuolisille skenaarioille.

sensetimen toiminnanjohtaja xu li on aiemmin sanonut, että tulevaisuudessa mallin älykkyys riippuu täysin siitä, onko malliajatteluketjun datan rakentamismenetelmä riittävän vahva ja voiko tämä riittävän vahva metodologia olla kestävää. ja iteratiivinen.

osittainen kuvakaappaus openai o1:n alkuperäisestä täydellisestä ajatteluketjusta

lopulta openai ei kuitenkaan päättänyt näyttää alkuperäistä ajatteluketjua käyttäjälle, vaan näyttää yhteenvedon ajatteluketjusta. openai selitti edelleen: "piilotetut ajatusketjut tarjoavat ainutlaatuisen mahdollisuuden seurata malleja. jos oletetaan, että malli on uskollisesti luettavissa, niin piilotetut ajatusketjut antavat meille mahdollisuuden "lukea" mallin ajatuksia ja ymmärtää sen ajatteluprosessia. tulevaisuudessa esim. saattaa haluta seurata ajatusketjuja käyttäjien manipuloimisen varalta. tämän tekemiseksi mallin on kuitenkin voitava ilmaista ajatuksensa vapaasti muuttumattomassa muodossa, joten emme myöskään voi harjoittaa käytäntöjen noudattamista eivät halua käyttäjien näkevän epäjohdonmukaisia ajatusketjuja suoraan."

tällä hetkellä chatgpt:n plus- ja team-käyttäjille on saatavilla kaksi o1-mallia, ja yritys- ja koulutuskäyttäjät voivat käyttää niitä ensi viikosta alkaen.

hitaampi mutta kalliimpi, ei gpt-4o:n "seuraaja".

tällä hetkellä viikoittainen viestiraja on 30 o1-esikatselussa ja 50 o1-minissä. openai sanoi, että se työskentelee kovasti lisätäkseen viestirajaa ja mahdollistaakseen chatgpt:n valitsemisen automaattisesti annettujen kehotteiden perusteella. se myös laajentaa pääsyn useammille käyttäjille ja aikoo tarjota o1-mini-käyttöoikeuden kaikille ilmaisille käyttäjille.

api (application programming interface) -puolella o1-esikatselu veloittaa 15 dollaria miljoonalta syöttötunnisteelta (suuret mallit jakavat tekstin sanoiksi, merkistöiksi tai sana- ja välimerkkien yhdistelmiksi) ja 60 dollaria miljoonalta lähtötunnisteelta. verrattuna gpt-4o:han syöttökustannukset ovat 3-kertaiset ja tuotantokustannukset ovat 4-kertaiset.

o1-mini on nopeampi paikannuksessa ja kustannustehokkaampi sillä on myös erinomainen suorituskyky matematiikassa ja ohjelmoinnissa. sitä voidaan käyttää vaihtoehtona o1:n kanssa o1-esikatseluun korkeampien nopeusrajoitusten ja alhaisemman viiveen ansiosta o1-mini on 80 % halvempi kuin o1-esikatselu api-käyttäjille.

muut haitat ovat myös ilmeisiä, openai o1 on hitaampi kuin muut mallit. ulkomaisten tiedotusvälineiden mukaan voi kestää yli 10 sekuntia, ennen kuin o1 vastaa tiettyihin kysymyksiin, ja malli näyttää edistymisen näyttämällä parhaillaan suoritettavien alitehtävien tunnisteet.

samaan aikaan, kun otetaan huomioon generatiivisten tekoälymallien arvaamattomuus, o1:llä voi olla muita puutteita ja rajoituksia. esimerkiksi tic-tac-toe-pelissä voidaan joskus tehdä virheitä. teknisessä artikkelissa openai sanoi, että jotkut testaajat olivat huhuilleet, että o1 oli herkempi hallusinaatioille kuin gpt-4o ja että se oli vähemmän halukas myöntämään, kun se ei tiennyt vastausta kysymykseen.

lisäksi o1 ei voi tällä hetkellä selata verkkoa tai analysoida tiedostoja.

altman myönsi suoraan, että o1 on tällä hetkellä openai:n tehokkain ja yhdenmukaisin mallisarja, mutta siinä on edelleen puutteita.

openai:n presidentti greg brockman sanoi myös, että o1-teknologia on vielä alkuvaiheessa ja openai tutkii aktiivisesti, mukaan lukien luotettavuus, hallusinaatiot ja kestävyys (vakaus) hyökkääjiä vastaan.

openai sanoi, että varhaisena mallina openai o1:ssä ei vielä ole monia ominaisuuksia, jotka tekevät chatgpt:stä hyödyllisen, kuten verkkotietojen selaaminen, tiedostojen ja kuvien lataaminen jne. monissa yleisissä tapauksissa gpt-4o:lla on paremmat ominaisuudet lyhyellä aikavälillä. säännöllisiä päivityksiä ja parannuksia seuraa, ja "työ jatkuu edelleen, jotta tämä uusi malli olisi yhtä helppokäyttöinen kuin nykyinen malli."

openai korostaa, että openai o1 ei ole gpt-4o:n "seuraaja", jota voidaan käyttää yhdessä o1:n päättelytoimintojen kanssa. se suunnittelee jatkavansa gpt-sarjan mallien kehittämistä ja julkaisua o1-sarjan jälkeen.

useiden vertailuarvojen vertailu openai o1:n ja gpt-4o:n välillä

on syytä mainita, että aiempien ulkomaisten tiedotusvälineiden mukaan openai saattaa harkita korkeampien veloitusstandardien asettamista "strawberry"-suurmallille tai seuraavan sukupolven lippulaivamallille, joka voi nousta enintään 2 000 dollariin kuukaudessa. vertailun vuoksi chatgpt plus:n nykyinen maksu on 20 dollaria kuukaudessa.

turbulent openai, milloin gpt-5 saapuu?

ulkomaisten tiedotusvälineiden mukaan mulati sanoi, että parhaillaan rakennetaan seuraavan sukupolven päämallia gpt-5, joka on paljon suurempi kuin edeltäjänsä. vaikka yritys uskoo edelleen, että mittakaava auttaa avaamaan uusia ominaisuuksia tekoälystä, gpt-5 sisältää todennäköisesti myös tällä kertaa lanseeratun päättelyteknologian.

"on kaksi paradigmaa", murati sanoi, "skaalausparadigma ja tämä uusi paradigma. haluamme tuoda ne yhteen."

gpt-5:n kehityspolku ei ole helppo.

syyskuun 11. päivänä paikallista aikaa alexis conneau, gpt-4o/gpt-5:n tutkimusjohtaja ja "herin" openai-version tekninen johtaja, ilmoitti yhtäkkiä eroavansa. aiemmin openai:n perustaja ja päätutkija ilja sutskever, super alignment -tiimin johtaja jan leike ja toinen perustaja john schulman , chatgpt:n johtaja peter deng ja muut ovat eronneet peräkkäin... tällä hetkellä vain kaksi 11 perustajasta pysyä openai:ssa.

henkilöstöhäiriön lisäksi openai:lla on myös tänä vuonna 5 miljardin dollarin tulo- ja menovaje.

mutta mitä voidaan nähdä, on se, että openai on jo ryhtynyt toimiin.

openai:n uusin suunnitelma on kerätä noin 6,5 miljardia dollaria, jolloin tämän rahoituksen arvo nousee 150 miljardiin dollariin. viime kuun lopussa paljastettiin, että openai valmistautui uuteen 1 miljardin dollarin rahoituskierrokseen, jota johtaa riskipääomayhtiö thrive capital, jossa microsoft, apple ja nvidia ovat mahdollisesti mukana sijoituksessa hieman yli 100 miljardia dollaria.

29. elokuuta paikallista aikaa openai ilmoitti, että chatgpt:llä on tällä hetkellä yli 200 miljoonaa viikoittaista aktiivista käyttäjää, kaksi kertaa enemmän kuin viime syksynä.

openai sanoo, että 92 % fortune 500 -yrityksistä käyttää sen tuotteita, ja sen api:n käyttö on kaksinkertaistunut heinäkuussa julkaistun chatgpt-4o minin jälkeen.

paperin toimittaja qin sheng

(tämä artikkeli on the paperista. jos haluat lisätietoja, lataa "the paper" -sovellus)

raportti/palaute

uutiset

hidasta ja kallista? openai-päätelmämalli "strawberry" on täällä, kuinka kaukana on gpt-5?

johdanto

yhteystietoni