onko openai "strawberry" biljoonan arvoinen?

2024-09-13

kirjoittaja |. bi andi, toimittaja wang jing

mitä yhteistä on ultramanilla ja ma baoguolla? vastaus: he kaikki haluavat suorittaa hiipiä.

"strawberryn" uutinen on kiertänyt useita kuukausia. sanotaan, että tämä on mystinen projekti openai:ssa, joka näyttää olevan aivan erilainen kuin edellisen sukupolven malli. mutta openai on pitänyt sen salassa lähin hetki, jolloin se paljastettiin, oli toimitusjohtaja sam altmanin sosiaalisessa mediassa julkaisema kuva aidoista mansikoista.

vain muutama päivä sitten the information julkaisi uutisen, että "strawberry" julkaistaan seuraavien kahden viikon aikana.

jopa näin suurella huomiolla, openai yllätti maailman: 12. syyskuuta iltapäivällä paikallista aikaa, ilman ennakkoilmoitusta tai lehdistötilaisuutta, openai julkaisi yhtäkkiä uuden mallin.

uuden mallin nimi ei kuitenkaan ole niin herkullinen kuin "mansikka", vaan erittäin vakava ja merkityksellinen: o1.

tiedäthän, openai-mallia on toistettu "gpt"-sarjassa aiemmin, gpt-1:stä vuonna 2018 gpt-4o:han tämän vuoden toukokuussa. tänään openai avaa uuden linjan.

virallisessa blogiviestissä, jossa kerrottiin o1:stä, openai sanoi näin: "varhaisena mallina siinä ei vielä ole monia ominaisuuksia, jotka tekevät chatgpt:stä hyödyllisen... mutta monimutkaisissa päättelytehtävissä tämä on merkittävä parannus ja edustaa tekoälyominaisuuksia. tämän vuoksi nollasimme laskurin arvoon 1 ja nimesimme tämän sarjan openai o1:ksi.

uusi malli on tällä hetkellä avoinna vain chatgpt:tä maksaville tilaajille ja joillekin ohjelmoijille. sen osoittamiseksi, että malli ei ole vielä kypsä, sitä kutsutaan väliaikaisesti "o1-esikatseluksi", ja esikatselu tarkoittaa esikatselua. lisäksi openai julkaisi myös pienen malliversion o1-mini. olipa kyseessä o1-preview tai o1-mini, tällä hetkellä vastausten määrä on rajoitettu viikossa.

ultraman itse kehui uutta mallia sosiaalisessa mediassa

gary marcus, tekoälytutkija, joka haluaa aina kaataa kylmää vettä chatgpt:hen, vitsaili, että openai:n siirto on "tuttu resepti": julkista demo, avaa se rajoitetulle määrälle käyttäjiä, kerää varoja ja tee se uudelleen.

o1:n julkaisuhetkellä openai:lla oli uusi rahoituskierros. bloombergin viimeisimpien uutisten mukaan tämä rahoituskierros on merkittävä tapahtuma, jonka mittakaava on kymmeniä miljardeja yhdysvaltain dollareita ja jonka tavoitearvo on 150 miljardia dollaria.

katsotaanpa ensin itse mallia.

kuten aiemmin huhuttiin, o1:n pääpaino on "päättelyssä". avain "päättelyn" takana on "ajattelu".

käyttäjille intuitiivisin tunne on, että o1-esikatselu kestää kauemmin ennen kuin vastaa kysymykseen.

o1-esikatselumallissa aakkosluettelo kysyy chatgpt:ltä "mikä kuukauden päivä ja viikonpäivä on tänään?" kun kysymys on lähetetty, chatgpt näyttää jatkuvat ajatteluvaiheensa yksitellen: päivämääräkysymykseen vastaaminen, ohjeiden tarkistaminen, nykyisen päivämäärän ymmärtäminen ja sitten vastauksen antaminen, jossa on merkintä "ajattele 8 sekuntia".

sitä vastoin gpt-4o-mallissa chatgpt antaa suoran vastauksen 3 sekunnissa näyttämättä välivaiheita.

"tämä on uusi suuri oraakkelimalli, joka on koulutettu vahvistusoppimisen avulla ja suunniteltu suorittamaan monimutkaisia päättelytehtäviä. o1 ajattelee ennen kuin vastaa kysymyksiin - se voi luoda sisäisen pitkän ajatusketjun ennen vastaamista, openai kirjoitti blogikirjoituksessaan."

tällä kertaa o1-malli julkaistiin, openai-virkailijat paljastivat hyvin vähän teknisiä yksityiskohtia, ja se, mitä he toistuvasti korostivat, oli "ajatteluketju".

openai:n mukaan o1 käyttää ajatusketjuja yrittäessään ratkaista ongelmia, aivan kuten ihmiset ajattelevat pitkään ja hartaasti ennen kuin he vastaavat vaikeaan kysymykseen. vahvistusoppimisen avulla o1 oppi jalostamaan ajatteluketjuaan ja optimoimaan käyttöstrategioitaan. se pystyy tunnistamaan ja korjaamaan omat virheensä sekä oppimaan jakamaan monimutkaiset vaiheet yksinkertaisempiin. kun nykyinen menetelmä ei toimi, se yrittää toista menetelmää.

"tämä prosessi parantaa huomattavasti mallin päättelykykyä."

joten kuinka vahva o1:n kyky on? openai:n julkaisemien useiden demonstraatiovideoiden lisäksi vakuuttavinta ovat testitulokset. openai sanoo, että o1 toimii "vertailussa ihmisten asiantuntijoihin" useissa päätelmiä vaativissa vertailuissa ja ylittää aiemmat tekniikat. esimerkiksi kansainvälisessä matematiikan olympialaisessa (imo) edellinen tekninen pistemäärä oli 13 % ja o1 peräti 83 %.

codeforces-ohjelmointikilpailussa o1 saavutti erinomaiset pisteet 89%. openai kehitti o1:n pohjalta myös ohjelmoinnissa paremman o1-ioin, jonka tulokset ylittivät yhdellä iskulla 93 % kilpailijoista.

toinen openai:n erityisesti "osoitteleva" testi on gpqa-timantti, joka on kemian, fysiikan ja biologian asiantuntemuksen vertailutesti. openai kutsui tohtorintutkintaasiantuntijoita kilpailemaan ja havaitsi, että "o1:n suorituskyky ylitti nämä ihmisasiantuntijat".

openai sanoi myös, että visuaalisen havaintokyvyn mahdollistamisen jälkeen o1 sai mmmu-testissä 78,2 %:n tuloksesta "tuleen ensimmäiseksi malliksi, joka voi kilpailla ihmisasiantuntijoiden kanssa". lisäksi o1 ylittää gpt-4o:n 54:ssä 57 mmlu-alaluokasta.

lyhyesti sanottuna o1 kiinnittää enemmän huomiota päättelykykyyn kuin openai:n aiemmat mallit, ja sen kykyjä matematiikassa ja ohjelmoinnissa on parannettu. , sen odotetaan myös vähentävän mallin illuusiota.

o1 on kuitenkin vielä suhteellisen varhaisessa vaiheessa, kuten ultraman korosti, "puutteita ja rajoituksia on edelleen".

vain aakkosluettelon matalassa yrityksessä tapahtui virheitä o1-esikatselussa. esimerkiksi kun kysyttiin "kumpi on suurempi, 9.11 vai 9.9?", gpt-4o vastasi väärin, ja o1-preview vastasi myös väärin sanoen vakavasti, että "9.11 on todellakin suurempi kuin 9.9. koska 9.11 (eli 9.11) on suurempi kuin 9,9 (9,90)." sanasanaisuudessa on aavistuksen huumoria, puhumattakaan siitä, että sen miettimiseen meni 15 sekuntia.

the information raportoi myös, että jotkut käyttäjät, jotka kokeilivat o1-esikatselua, sanoivat, että monet vuorovaikutukset "ei olleet ylimääräisen 10-20 sekunnin odotuksen arvoisia" ja että he pitivät parempana gpt-4o:n vastausnopeutta.

tällä hetkellä o1-preview ja o1-mini ovat avoinna maksaville käyttäjille, mutta määrä on rajoitettu: o1-previewilla on 30 viestiä viikossa ja o1-minissä 50 viestiä viikossa.

ensi viikosta alkaen molemmat mallit ovat myös chatgpt:n yritys- ja koulutuskäyttäjien (edu) käytettävissä. openai ilmoitti myös haluavansa tarjota o1-minin kaikille käyttäjille tulevaisuudessa ilmaiseksi, mutta tarkkaa aikaa ei ole kerrottu.

tämä on ensimmäinen kerta, kun openai on lisännyt mallin julkaisemisen yhteydessä "esikatselua" vastaavan päätteen. aiemmin sekä gpt-4 että gpt-4o ovat julkaisseet koko mallin.

yksi o1:n ominaisuus, jota ei voida jättää huomiotta, on, että se on kallis.

o1:n kehittäjän käyttökustannukset ovat erittäin korkeat: api:n osalta o1-esikatselu veloittaa 15 dollaria 1 miljoonasta mallin jäsentämästä syöttötunnisteesta tai tekstilohkosta, kolme kertaa gpt-4o:n ja 60 dollaria miljoonasta tulostetunnisteesta usd. , neljä kertaa gpt-4o:hon verrattuna.

atlantic analysoi raportissa, että o1 on erityisesti suunniteltu vaatimaan enemmän aikaa, mikä väistämättä kuluttaa enemmän resursseja ja vaikeuttaa aigc:n kannattavuutta.

tämän artikkelin alussa mainittu gary marcus on tutkija ihmisen neurotieteen ja tekoälyn risteyksessä, new yorkin yliopiston kunniaprofessori ja ai-startupin geometric intelligencen perustaja ja toimitusjohtaja on "tekoälymaailman piikki" on toistuvasti arvostellut openai:ta.

hänen mielestään openai:n äkillinen o1-esikatselun julkaisu on enemmänkin propagandamenetelmä.

loppujen lopuksi openai käy läpi tärkeän rahoituskierroksen bloombergin viimeisimmän raportin mukaan openai neuvottelee 6,5 miljardin dollarin keräämisestä sijoittajilta 150 miljardin dollarin arvosta. lisäksi se haluaa kerätä 5 miljardia dollaria pankkien valmiusluottojen muodossa.

"lähetä demo, avaa se rajoitetuille käyttäjille, kerää rahaa ja toista näin."

tämän vuoden heinäkuussa the information raportoi, että openai voi menettää jopa 5 miljardia dollaria tänä vuonna. niistä openai:n työntekijäkustannukset ovat tänä vuonna noin 1,5 miljardia dollaria, tekoälyn koulutus- ja päättelykustannukset voivat olla jopa 7 miljardia dollaria, ja vuositulojen odotetaan olevan 3,5 - 4,5 miljardia dollaria.

tuolloin the information ennusti, että tällä rahanpolttonopeudella openai joutuisi pian keräämään varoja. viimeinen tärkeä rahoitus openai:lle oli vuoden 2023 alussa, jolloin microsoft sijoitti kymmeniä miljardeja dollareita.

tämä ei ole ensimmäinen kerta, kun openai on julkaissut "epäkypsiä tuotteita" avainsolmuissa.

viime vuoden lokakuussa uutisoitiin, että openai pyrki myymään osakkeita. tuolloin huhuttiin, että mahdollinen arvo oli 86 miljardia dollaria. mutta seuraavana kuussa openai koki järkyttävän muutoksen ylimmässä johdossa altman erotettiin yrityksestä, mutta hän palasi pian toimitusjohtajan asemaan voittaen "palatsitaistelun". osakemyyntisuunnitelma kuitenkin viivästyi hetken, eikä kaupan "palautumisesta" ollut uutisia marraskuun loppuun asti. tuolloin asiaan perehtyneet kertoivat, että työntekijät olivat huolissaan siitä, että poikkeustilanne vaikuttaa osakemyyntiin ja vaikuttaa yhtiön arvoon.

mielenkiintoista on, että tämän vuoden helmikuun 15. päivänä openai julkisti yhtäkkiä uuden videosukupolven mallin sora, ja demo aiheutti shokin ulkomaailmalle. new york times raportoi kolmen päivän kuluessa, että openai sai päätökseen työntekijöiden osakkeiden myynnin ja yhtiön arvo ylitti 80 miljardia dollaria "odotusti".

yli puoli vuotta on kulunut, eikä sora ole ollut avoin yleisölle eikä edes edistänyt laajamittaista testausta. ulkomaailma alkoi epäillä, että soralla ei itse asiassa ollut tarpeeksi laskentatehoa toimintansa tukemiseksi. markkinatutkimusorganisaation factorial fundsin julkaiseman raportin mukaan soran käyttöönottoon tarvitaan 720 000 nvidia h100 -sirua.

syyskuun alussa "taiwan economic daily" raportoi, että tsmc:n a16 angstrom-tason siru oli jo saanut tilauksia suurilta asiakkailta, mukaan lukien apple ja openai. openai käyttää mukautettuja siruja parantaakseen soran videontuotantokykyä. tämä näyttää myös vahvistavan, että sora kohtasi laskentatehotukoksen aiemmin.

nyt kun mansikanmakuinen chatgpt on täällä, saatamme ehkä pian nähdä uutisen, että openai on onnistuneesti saattanut päätökseen uuden rahoituskierroksen ja sen arvo on yli biljoona yuania.

uutiset

onko openai "strawberry" biljoonan arvoinen?

johdanto

yhteystietoni