uutiset

"Tehokkain toiminto ja alhaiset kustannukset"! OpenAI julkaisee GPT-4o minin osallistuakseen pienten mallien kilpailuun

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI julkaisi "GPT-4o minin" torstaina Itä-aikaa osallistuen "pienten mutta hienostuneiden" AI-mallien kilpailuun. Se kutsui tätä uutta mallia "tehokkaimmaksi ja edullisimmaksi malliksi" ja aikoi integroida kuvia, videoita ja ääntä tulevaisuudessa tähän malliin.

Yli 60 % halvempi kuin GPT-3.5 Turbo, ja chat-suorituskyky on parempi kuin kilpailevat tuotteet

Yhtiö sanoi, että GPT-4o mini on ChatGPT-ilmaisten käyttäjien, ChatGPT Plus- ja Teams-tilaajien saatavilla torstaista alkaen, ja se on ChatGPT-yrityskäyttäjien saatavilla ensi viikolla. GPT-4o mini korvaa vanhemman mallin GPT-3.5 Turbo ChatGPT:ssä. OpenAI sanoi, että GPT-4o mini maksaa 15 senttiä miljoonalta syöttötunnisteelta ja 60 senttiä miljoonalta lähtötunnisteelta, mikä tekee siitä yli 60 % halvemman kuin GPT-3.5 Turbo.

Yhtiö sanoi myös, että uusi malli on tällä hetkellä parempi kuin GPT-4-malli chat-asetuksissa ja saavutti 82 % pistemäärän massiivisessa monitehtäväkielen ymmärtämisen (MMLU) testissä. Mediatietojen mukaan MMLU on tekstiälyn ja päättelyn benchmark, jota käytetään arvioimaan kielimallin ominaisuuksia. Korkeampi MMLU-pistemäärä osoittaa parempaa kielen ymmärtämistä ja käyttöä useilla eri aloilla, mikä parantaa sen reaalimaailman sovellusta.

OpenAI-tietojen mukaan GPT-4o minimalli sai 82 %, mikä on korkeampi kuin kaksi muuta halpakilpailijaa, Googlen Gemini Flash 77,9 % ja Anthropicin Claude Haiku 73,8 %.

Suuremmista malleista GPT-3.5 sai tässä testissä 70 %, GPT-4o 88,7 % ja Google väittää, että sen Gemini Ultra saavutti kaikkien aikojen korkeimman pistemääränsä, 90 %.

Analyysi viittaa siihen, että pienemmät kielimallit vaativat vähemmän laskentatehoa toimiakseen, mikä tekee niistä edullisemman vaihtoehdon yrityksille, joilla on rajalliset resurssit generatiivisen tekoälyn käyttöön.

Lisäksi tämä uusi kevyt malli tukee myös teksti- ja visuaalisia ominaisuuksia API:ssa, ja OpenAI sanoo, että se käsittelee pian kaiken multimodaalisen tulon ja lähdön, kuten videon ja äänen. Näiden ominaisuuksien avulla tämä voisi mahdollisesti toimia tehokkaampana virtuaalisena avustajana, joka voi ymmärtää matkasuunnitelmasi ja antaa suosituksia. Tätä mallia voidaan kuitenkin tällä hetkellä käyttää vain pääasiassa yksinkertaisiin tehtäviin.

Kilpailu "pienistä mutta hienostuneista" tekoälymalleista on kovaa ja OpenAI astuu vihdoin peliin

Mediatietojen mukaan Microsoftin tukeman OpenAI:n arvo on ylittänyt 80 miljardia dollaria. Vaikka se on edelleen johtavassa asemassa generatiivisten tekoälyjen markkinoilla, yhtiö kohtaa kasvavaa kilpailupainetta. OpenAI:n on myös löydettävä tapoja ansaita rahaa, koska yritys käyttää paljon rahaa prosessoreihin ja infrastruktuuriin mallien rakentamiseen ja kouluttamiseen.

Monilla yrityksillä ei kuitenkaan ole varaa suurempiin, kalliimpiin malleihin, joten kevyet ja halvemmat mallit voivat olla suositumpia. Siihen asti monet kehittäjät valitsisivat Claude 3 Haikun tai Gemini 1.5 Flashin sen sijaan, että he maksaisivat tehokkaimpien mallien käyttämiseen vaadittavia korkeita laskentakustannuksia. Pienempi malli voi esimerkiksi sopia parhaiten suurten perustehtävien automatisointiin, kun taas suurempi malli voi hoitaa monimutkaisempia töitä. Jotkut kehittäjät saattavat haluta käyttää molempia malleja yhdessä sovelluksessa.

Olivier Godement, OpenAI:n API-tuotepäällikkö, selitti haastattelussa medialle, miksi yritys ei onnistunut tuomaan markkinoille "pieniä ja hienostuneita" tekoälymalleja. Hän sanoi, että tämä oli puhtaasti "prioriteettikysymys", koska OpenAI keskittyi luomaan suurempia ja parempia mallit, kuten GPT-4, vaativat merkittäviä henkilö- ja laskennallisia resursseja. Ajan myötä OpenAI huomasi, että kehittäjät olivat yhä innokkaampia käyttämään pienempiä malleja, joten yritys päätti, että nyt oli aika investoida resursseja GPT-4o Minin kehittämiseen.

"Missiomme on tehdä uusinta teknologiaa ja rakentaa tehokkaimpia ja hyödyllisimpiä sovelluksia, ja toivomme varmasti jatkavamme huippuluokan mallien tekemistä ja edistävämme teknologista kehitystä", OpenAI:n API-tuotejohtaja Olivier Godement sanoi haastattelussa. Media. "Mutta haluamme myös parhaan pienen mallin ja uskon, että se tulee olemaan erittäin suosittu."

"Mielestäni GPT-4o Mini todella ilmentää OpenAI:n tehtävää tehdä tekoäly helpommin saavutettavissa. Jos haluamme, että tekoäly hyödyttää kaikkia maailman kolkkeja, kaikkia toimialoja ja kaikkia sovelluksia, meidän on tehtävä tekoälystä edullisempia OpenAI:n API-alustan tuotteista, johtaja Olivier." Godement kertoi medialle.

GPT-4o mini auttaa työntekijöitä keskittymään

Godement sanoi, että jotkut kehittäjät ovat kokeilleet mallia viime viikon aikana.

OpenAI pyysi fintech-käynnistysyritystä Rampia testaamaan mallia GPT-4o Minin avulla rakentamaan työkalun, joka poimii kulutiedot kuiteista. Käyttäjät voivat siis ladata kuvia kuiteistaan ​​ja malli järjestää tiedot heidän puolestaan. Sähköpostiohjelma Superhuman testasi myös GPT-4o Minin ja loi sen avulla ominaisuuden, joka ehdottaa automaattisesti sähköpostivastauksia.

Aluksi GPT-4o mini pystyy käsittelemään ja luomaan tekstiä ja kuvia. Kun lopullinen versio on valmis, OpenAI sanoo, että se pystyy käsittelemään muun tyyppistä sisältöä.

OpenAI sanoi myös, että GPT-4o mini on yhtiön ensimmäinen tekoälymalli, joka käyttää uutta tietoturvapolitiikkaansa "ohjehierarkiaa". Tämän lähestymistavan tavoitteena on saada tekoälyjärjestelmät priorisoimaan tietyt ohjeet - kuten yritysten antamia - jotta ihmisten on vaikeampi saada työkalu tekemään jotain, mitä sen ei pitäisi tehdä.

Analyysi uskoo, että GPT-4o-minimalli on osa OpenAI:n sitoutumista "multimodaalisuuteen", toisin sanoen tarjota laaja valikoima tekoälyn luomaa mediaa (kuten tekstiä, kuvia, ääntä ja videota) yhdessä työkalussa: ChatGPT.

Viime vuonna OpenAI COO Brad Lightcap kertoi medialle:

"Maailma on multimodaalinen. Jos ajattelee tapaa, jolla me ihmiset prosessoimme ja olemme tekemisissä maailman kanssa, näemme asioita, kuulemme asioita, puhumme – maailma ei ole pelkkää tekstiä. Joten meille on olemassa vain tekstiä ja koodia Yksi modaliteetti, yksi käyttöliittymä tuntuu aina epätäydelliseltä, koska näiden mallien teho ja se, mitä ne voivat tehdä, ovat paljon enemmän."