uutiset

paljastetaan, että openai:n salaperäinen malli "strawberry" julkaistaan ​​kahden viikon kuluttua. kysymykseen vastaaminen kestää yli kymmenen sekuntia ja tilaushinta voi olla jopa 10 kertaa kalliimpi.

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

viime kuussa openai:n toimitusjohtaja altman nappasi paljon otsikoita valokuvalla mansikoista. nyt ehkä mansikkamalli todella "kypsyy".

the informationin mukaan osana chatgpt-palveluaopenai aikoo julkaista "strawberry" -mallin kahden viikon sisällä.

tietysti raportissa todetaan myös, että lopullinen julkaisupäivä saattaa muuttua, joten ole varovainen.

luotettava vinkijä @apples_jimmy uskoo, että mansikkamallin odotetaan ilmestyvän tällä viikolla.

hän sanoi myös, että openai:n odotetaan julkaisevan lokakuussa uuden mallin nimeltä gpt-4.x, jonka nimi voi olla gpt-4.5.

mitä tulee tehokkaampaan gpt-5-malliin, kuulin, että se voitaisiin julkaista jo joulukuussa, mutta varmuuden vuoksi ehdotan, että odotat sen vuoden 2025 ensimmäisellä tai toisella neljänneksellä.

tiedotuksen mukaan on epäselvää, missä muodossa mansikkamalli lanseerataan.yksi mahdollisuus on, että mansikkamalli on erillinen tuote.

toinen mahdollisuus on, että mansikka malliintegroidaan chatgpt-mallin valintavalikkoon, käyttäjät voivat vaihtaa eri mallipalveluiden välillä mielensä mukaan.

aiemmissa raporteissa mainittiin myös, että suurin ero mansikkamallin ja muiden mallien välillä on sese osaa "ajatella" ennen kuin vastaa kysymykseen.

lisäksi mansikkamalli ei suoriudu hyvin vain matematiikassa ja ohjelmoinnissa, vaan jos sille annetaan enemmän "ajatteluaikaa", se voi vastata myös asiakkaiden kysymyksiin subjektiivisista aiheista, kuten tuotemarkkinointistrategioista.

tiedossa todetaan,mansikkamallin ajatteluaika kestää yleensä 10-20 sekuntia, minkä etuna on se, että se auttaa vähentämään virheitä.

ja koska mansikkamallissa kuluu enemmän aikaa ajatteluun, tämä johtaa siihen, että se pystyy ymmärtämään, milloin sen on kysyttävä asiakkaalta lisää kysymyksiä ymmärtääkseen täysin käyttäjän tarpeet.

lisäksi mansikkamallissa on myös joitain eroja gpt-4o-malliin verrattuna. esimerkiksi sen alkuperäinen versiosillä ei ole gpt-4o:n monimalliominaisuuksia, voi vastaanottaa ja luoda vain tekstivastauksia, mutta ei voi käsitellä kuvia.

the information uskoo, että tämä voi johtua siitä, että myös kilpailijat lanseeraavat samankaltaisia ​​tuotteita, joten vaikka tämä tuote ei olisi joiltain osin täydellinen (kuten ei pysty käsittelemään kuvia), openai voi vain nopeuttaa julkaisua.

tässä yhteydessä ilmiantaja @apples_jimmy mainitsi myös, anthropic ja google valmistelevat myös salaa uusia mallejaan,ja aikoo julkaista sen yhdysvaltain vaalien aikoihin.

lisäksi tilaushinta on toistuvasti herättänyt käyttäjien tunteita.

chatgpt on julkaissut uuden maksullisen tason, chatgpt pron, ja on jo toimittanut sen joillekin käyttäjille.hinta 200€/kk, kymmenen kertaa kalliimpi kuin nykyinen 20 dollaria/kk.

jos pitää paikkansa, tämä saattaa myös heijastaa edellä mainittuja mansikkamallia koskevia raportteja.

tiedot huomautti myös, että mansikkamalli saattaa olla rajoitettu sen suhteen, kuinka monta kertaa käyttäjä voi käyttää sitä tunnissa, kuten chatgpt plus, kun taas mallit, joilla on korkeammat tilaushinnat, reagoivat paremmin.

lehdistöaikaan mennessä openai ei ole vastannut tähän asiaan.

leikkaa "mansikat" kerros kerrokselta

mitä openai:n "strawberry"-malli merkitsee meille?

itse asiassa strawberry modelin edeltäjä on "q*", mystinen olemassaolo, joka aiheutti kohua viime vuoden lopussa.

viime marraskuussa sam altman erotettiin hallitukselta ilman varoitusta. hän jopa sai ilmoituksen kokouksessa, mikä järkytti koko yritystä ja koko toimialaa.

syynä hallituksen tuolloin oli se, että hän ja tiimi eivät päässeet sopimukseen turvallisuudesta ja riskienhallinnasta. ja tämä riski liittyi tuolloin huippusalaiseen projektiin "q*".

tätä projektia johti alun perin ilja sutskever. nyt hän on lähtenyt openai:sta perustaakseen tekoälyn turvallisuuteen liittyvää liiketoimintaa. kun otetaan huomioon, että musk sanoi kerran, että tämä projekti "aiheuttaa uhkan ihmiskunnalle", on vaikea olla ihmettelemättä, mitä täällä tapahtuu.

aiemmin the information ja reuters yrittivät parhaansa mukaan saada sisäpiiritietoa, mutta lopulta he pystyivät vain vahvistamaan sen.matemaattinen toimintakyky on "q*":n painopiste

kuva: reuters

iso malli on hyvä "kirjallisessa" ja osaa käsitellä kieltä ja tekstiä taitavasti. se on periaatteessa ihmisten tasolla. mutta matemaattiset leikkaukset eivät ole koskaan olleet kovin hyviä. vaikka "q*" laukaisi kerran valtavan muutoksen openai:ssa, reutersin mukaan sen suorituskyky oli tuolloin noin peruskoululaisen tietojenkäsittelyn tasoa.

tällä hetkellä tunnetut murtotiedot osoittavat, että openai:ssa on jo projekteja, jotka voivat saavuttaa 90 % tarkkuuden matemaattisissa operaatioissa, mikä on hämmästyttävä parannus.

kuva: reuters

haluan korostaa: tällä hetkellä on mahdotonta vahvistaa, minkä askeleen "mansikka" on saavuttanut.

voidaan vain sanoa, että jos "strawberrya" käytetään "q*":n päivitettynä versiona, on suuri todennäköisyys, että kyseessä on projekti, joka jatkaa läpimurtojen etsimistä matematiikassa ja tietojenkäsittelyssä.

"matemaattisen laskennan" ja "päättelyn" suhdetta ei voida suoraan rinnastaa, mutta se paljastaa openai:n tavoitteet.

puhun aina päättelystä, mistä oikein puhut?

mitä "päättely" sitten oikein on?

näillä kahdella sanalla on ilmeisesti hyvin laaja määritelmä todellisuudessa. tämän vuoden alussa hongkongin kiinalaisen yliopiston johtama ryhmä teki kattavan katsauksen mallipohjaisen päättelyn kyvyistä. perusteellisin määritelmä "päättelylle" on kolme:

kognitiivinen päättely: kyky tehdä merkityksellisiä johtopäätöksiä epätäydellisestä ja epäjohdonmukaisesta tiedosta

yleisin tällaisen päättelyn muoto on palapelin kokoaminen. jokainen pieni pala on valtavan kuvan nurkka.

voit vain pitää näitä pieniä palasia ja yhdistää ne hitaasti muodostaaksesi valmiin kuvan. tässä prosessissa ei ole ohjeita tai vaihekaavioita, ja usein joudut luottamaan tunteeseen ja intuitioon.

looginen päättely: tee johtopäätökset järjestykseen perustuen premissioihin ja näiden premissien väliseen suhteeseen, ja johtopäätöksellä on implisiittinen suhde tai se on loogisesti perustettu

matematiikan ongelmanratkaisu on tyypillistä loogista päättelyä. näiden perusteella voit laskea tulokset askel askeleelta. looginen päättely on tällä hetkellä "kovin luu" suurten mallien kehittämisessä.

luonnollisen kielen päättely: tämä on prosessi, jossa integroidaan useita erityyppisiä tietoja, jotka voivat olla eksplisiittisiä tai implisiittisiä tietoja, jotta voidaan tehdä uusia johtopäätöksiä maailmasta.

ystävien, jotka haluavat lukea dekkareita ja mysteeriromaaneja, pitäisi olla helppo ymmärtää. tällainen pohdiskelu on kuin murhatarinaan törmääminen. kirjassa on epämääräisiä vihjeitä ja epäselviä tietoja.

jos katsot vain reutersin hankkimia sisäisiä openai-asiakirjoja, "strawberryn" tavoitteena on suunnitella, käyttää internetiä ja tehdä perusteellista tutkimusta.

nämä näyttävät enemmän viimeiseltä luonnolliselta kielen päättelyltä, mikä ei ole muuta kuin sen vahvistamista. on vaikea sanoa, voidaanko sitä pitää päättelykyvyn parantuneena.

mutta,openai ei ole niin jäykkä "päättelyn suhteen", mutta sillä on laajempi visio

kaksi kuukautta sitten john schulman, yksi openai:n perustajista, sanoi dwarkensh-podcastissa, että gpt-4:n edistyminen johtuu suurelta osin koulutuksen jälkeisestä tekniikasta.

"on erittäin monimutkaista luoda mallia, jolla voi olla toimintoja, joista ihmiset välittävät jälkikoulutuksen kautta", sanoi john schulman. "tämä vaatii paljon investointeja ja paljon t&k-työtä, mikä luo esteitä koulutukselle. tietyssä määrin."

john schulmanin "päättelyn" määritelmä on tämä:

"päättely tarkoittaa, että tarvitaan joitain laskelmia tai joitain päätelmiä. tämän määritelmän perusteella on välttämätöntä pystyä suorittamaan laskelmia ja vaiheittaisia ​​laskelmia tehtävää käsiteltäessä."

nähdään, että hänen määritelmässään päättely ja laskennallinen käyttäytyminen ovat vahvasti sidottuja, ja toivotaan, että konepäättely voidaan suorittaa reaaliajassa - kuten ihmiset, he voivat analysoida ja tulkita vastaanottaessaan tietoa.

vaikka ihminen ei olisikaan hyvä matematiikassa, se ei estä häntä ajattelemasta asioita loogisesti ja hän voi silti suorittaa erilaisia ​​päättelyjä. miksi koneiden matemaattinen kyky on niin tärkeä?

sen voi ymmärtää näin:matematiikka ei ole koskaan pelkkää operaatioiden tekemistä, se on myös tapa ilmaista tietoa.

matematiikka on kieli, joka luottaa enemmän symboliseen muotoon ja merkityksen tarkkuuteen, jossa 1 on 1 ja 0 on 0. kun informaation esittämiseen käytetään laskennallisia symboleja ja yhtälöitä, se on itse asiassa pienempiulotteinen kuin luonnollinen kieli.

toisin sanoen syy siihen, miksi suuret mallit ovat "lukutaitoja", on se, että ne perustuvat "laskentaan" ja muuntavat luonnollisen kielen tietokonekieleksi.

perustan tälle loi jo 1800-luvulla george boole, yksi historian tärkeimmistä matemaatikoista (sama boole, joka loi boolen muuttujan).

george boole

boole oli syvästi uskonnollinen mies, joka jopa halusi selittää jumalan olemassaolon matemaattisen päättelyn avulla.

riippumatta siitä, mikä hänen lopullinen päätelmänsä oli, rikkaus, jonka hän lopulta jätti maailmalle, joka on kirja "ajattelun lakien tutkimus", selittää hänen suuren tavoitteensa alussa: käyttää laskennan symbolista kieltä ilmaisemaan käsitettä päättelyn peruslaki.

tämä selittää myös sen, miksi ihmisten odotukset ovat hieman hermostuneempia tekoälyn suorituskyvystä matemaattisissa operaatioissa:

kun murtaudut matemaattisen kielen läpi, saatat todella olla lähellä murtaaksesi ajattelutoimintojen läpi.

openai-teknologian veteraanit ovat jälleen eronneet

on olemassa hyvin outo ilmiö, joka vaikuttaa siltä, ​​että jokaiseen isoon uutiseen openai:n teknologian sisäpiiriläisistä liittyy aina rajuja henkilöstömuutoksia.

sattumalta myös useat openai:n sisäiset työntekijät ilmoittivat tänään virallisesti eroavansa.

esimerkiksi alexis conneau, openai audio agi:n entinen tutkimusjohtaja, ilmoitti lähtevänsä perustamaan liiketoimintaa. toisessa ominaisuudessaan hän on tärkeä tekninen jäsen gpt-4o-tutkimusryhmässä.

ennen gpt-4o:n julkaisua hän ennusti innoissaan, että se saattaa aloittaa uuden aikakauden ihmisen ja tietokoneen vuorovaikutuksessa.

hän liittyi openai:hen huhtikuussa 2023 saatuaan laajan työkokemuksen suurissa yrityksissä, kuten googlessa ja metassa. hänen sanojensa mukaan päätehtävänä on varustaa gpt-malli "puhuvalla suulla".

prafulla dhariwal, gpt-4o:n tutkimusryhmän johtaja, kehui kerran conneaua:

alexis conneau keksi vision häntä ennen kuin kukaan openai:ssa ja työskenteli väsymättä toteuttaakseen sen käytännössä!

tai neljä ja puoli vuotta openai:ssa työskennellyt arvind neelakantan on myös siirtynyt "vihollisleirin" meta ai -tutkimustiimiin tänään.

hän on osallistunut monien tärkeiden openai-projektien kehittämiseen, mukaan lukien embeddings, gpt-3 ja gpt-4, api ja chatgpt jne.

neelakantan sanoi, että openai:ssa työskentely oli hänen uransa kohokohta. meta ai:ssa hän keskittyy seuraavan sukupolven llama-mallin kehittämiseen.

tältä osin myös entinen openai:n kehittäjäsuhteiden johtaja logan kilpatrick lähetti erosiunauksensa.

tämän vuoden alusta lähtien openai on käynnistänyt erojen aallon, ja sen perustajatiimi on jopa "hajautunut".

entinen päätutkija ilja sutskever ilmoitti juuri vetäytyvänsä openai:sta, ja myös jan leike, yksi rlhf:n keksijistä, seurasi hänen jalanjäljänsä ja lähti.

lähdön syyt ovat pohjimmiltaan erilaiset, paitsi viime vuoden "palace fight" -tapahtuman jälkimainingeissa, se voi johtua myös henkilökohtaisesta urasuunnittelusta.

openai:n jyrkät henkilöstömuutokset eivät todennäköisesti vaikuta tekoälyn kilpailuympäristöön lyhyellä aikavälillä. samaan aikaan taantuman keskellä kehittymätön tekoälyteollisuus ei enää siedä yhden vuoden ikkunaa.

jatkuvan malliuutisten julkistamisen myötä odotamme innolla näkevämme upean tekoälynavigoinnin aikakauden jälleen vuoden toisella puoliskolla.

olipa se kuinka huono tahansa, se on ainakin mielenkiintoisempaa kuin tylsät uudet ai-tekniikat vuoden ensimmäisellä puoliskolla.

on ennakoitavissa, että tekoälyteknologian taustalla olevan mallin kehitys voi olla kuin voimakas liikkeellepaneva voima, joka ajaa koko sovelluspuolen räjähdysmäiseksi, aivan kuten gpt-4:n ilmestyminen tuolloin, tuoden meille kauan kadonneita yllätyksiä.

siihen mennessä me käyttäjät olemme aina suurimmat edunsaajat.