GPT-4o-versio "Her" on vihdoin täällä! Vitsit kertominen ja kissa miaukuminen, kuinka seksikäs tekoälytyttöystävä voi olla?

2024-07-31

Uusi viisausraportti

Toimittaja: Taozi on niin uninen

[Johdatus uuteen viisauteen] GPT-4o-äänitoiminto saapuu vihdoin odotetusti, ja Herin scifi-versio toteutuu! Jotkut harmaasävyä testaaneet nettikäyttäjät ovat menneet hulluiksi, mutta OpenAI tarjoaa tällä hetkellä vain 4 esiasetettua ääntä. Lisäksi uuden GPT-4o-mallin lähtötunnus nousi 16 kertaa 64 kt:iin.

Ultramanin lupaus toteutui vihdoin.

Ennen heinäkuun loppua GPT-4o-äänitila on vihdoin käynnistänyt harmaasävytestauksen, ja pieni osa ChatGPT Plus -käyttäjistä on jo hankkinut varhaisen käyttöönoton liput.

Jos näet seuraavan käyttöliittymän ChatGPT-sovelluksen avaamisen jälkeen, onnittelut siitä, että olet yksi ensimmäisistä onnekkaista.

OpenAI:n mukaan edistynyt äänitila tarjoaa luonnollisemman, reaaliaikaisen keskustelun, voidaan keskeyttää halutessasi ja jopa aistia tunteitasi ja vastata niihin.

On odotettavissa, että kaikki ChatGPT Plus -käyttäjät voivat käyttää tätä ominaisuutta tänä syksynä.

Lisäksi tehokkaampi videon ja näytön jakaminen julkaistaan myöhemmin. Toisin sanoen kytkemällä kameran päälle voit keskustella "kasvotusten" ChatGPT:n kanssa.

Jotkut verkkokäyttäjät, joihin harmaasävy vaikutti, alkoivat testata peräkkäin ja löysivät monia GPT-4o-äänitilan käyttötapauksia.

Ei, jotkut ihmiset antavat sen toimia "toisena vieraan kielen valmentajana" opettaessaan itseään harjoittelemaan puhumista.

Seuraavassa opetuksessa ChatGPT auttoi verkkokauppiaita korjaamaan croissant (croissant) ja patonki (ranskalainen patonki) ääntämisen.

Samaan aikaan GPT-4o:n ulostulotokenit kasvoivat 16 kertaa, alkuperäisestä 4 000 tunnuksesta 64 000 tunnukseen.

Tämä on uusi beta-malli gpt-4o-64k-output-alpha, jonka OpenAI julkaisi hiljattain virallisella verkkosivustollaan.

Pidempi tuloste tarkoittaa, että noin 4 täydellistä kokopituista elokuvakäsikirjoitusta voidaan hankkia kerralla.

Hän on tullut

Syy, miksi GPT-4o-äänitoiminto julkaistaan nyt, johtuu siitä, että OpenAI on tehnyt sille turvallisuus- ja laatutestejä viime kuukausina.

He testasivat GPT-4o:n ääniominaisuuksia 45 kielellä yli 100 punaisen tiimin jäsenen kanssa.

Suojellakseen ihmisten yksityisyyttä tiimi koulutti mallin puhumaan vain neljällä "oletusäänellä".

He loivat myös järjestelmän, joka estää muiden kuin näiden neljän äänen ulostulon.

Lisäksi sisällön suodattaminen on myös välttämätöntä, ja tiimi on myös ryhtynyt toimiin väkivaltaisen ja tekijänoikeuksiin liittyvän sisällön syntymisen estämiseksi.

OpenAI on ilmoittanut aikovansa julkaista yksityiskohtaisen raportin GPT-4o:n ominaisuuksista, rajoituksista ja turvallisuusarvioinnista elokuun alussa.

Todellinen mittaus koko verkossa

Alla on joitain nettikäyttäjien jakamia GPT-4o-äänitilan tapauksia.

ChatGPT voi suorittaa beatboxia.

ChatGPT kertoi myös olutvitsejä ujoin, vihaisin ja vihaisemmin sävyin.

Jotkut nettimiehet kertoivat vitsin erityisesti ChatGPT:tä varten: "Miksi tiedemiehet eivät usko Adam-Atomiin, koska ne muodostavat kaiken."

ChatGPT nauroi kiusallisesti.

Vielä hauskempaa on, että ChatGPT:llä on edelleen tapa oppia miaumaan.

Testauksen jälkeen joku havaitsi, että ChatGPT:n edistynyt äänitila on erittäin nopea, eikä vastaamisessa ole juurikaan viivettä.

Kun sitä pyydetään matkimaan joitain ääniä, se toistaa äänet aina realistisesti. Ja erilaisia aksentteja voidaan myös jäljitellä.

Alla oleva video näyttää kohtauksen, jossa tekoäly toimii jalkapallo-ottelun kommentaattorina.

ChatGPT kertoo tarinoita kiinaksi, mikä on myös erittäin elävää.

Vaikka OpenAI väittää, että video- ja näytönjakotoiminnot lanseerataan myöhemmin, jotkut verkkoyhteisöt ovat jo käyttäneet sitä ensin.

Nettikäyttäjällä on uusi lemmikkikissa Hän rakensi sille pesän ja valmisti sille ruokaa, mutta hän ei tiennyt mitä tehdä, joten hän kysyi ChatGPT:ltä.

Videon keskustelun aikana nettimies näytti kissan taloa nähtyään sen, ChatGPT kommentoi: "Sen täytyy olla erittäin mukava" ja oli huolissaan siitä, kuinka kissa voi.

Netizens sanoi, että se ei ole vielä syönyt ja näyttää hieman huolestuneelta. ChatGPT lohdutti: "Tämä on normaalia. Kissojen sopeutuminen vie aikaa."

Voidaan nähdä, että koko kysymys-vastausprosessi on erittäin sujuvaa, mikä antaa ihmisille tunteen kommunikoinnista oikeiden ihmisten kanssa.

Netizenit kaivoivat esiin myös japanilaisen version pelikonsolista, mutta he eivät puhu japania.

Tällä hetkellä hän näytti pelin käyttöliittymän ChatGPT:lle ja pyysi häntä kääntämään sen itselleen. Lopulta Hu sai pelin valmiiksi yhdessä.

Minun on sanottava, että visuaalisen + äänitilan siunauksella ChatGPT on paljon vahvempi.

GPT-4o Long Output on hiljainen online-tilassa jopa 64K:n ulostulolla

Lisäksi seuraa GPT-4o, joka tukee suurempaa token-tulostusta.

Juuri eilen OpenAI ilmoitti virallisesti, että se tarjoaa testaajille GPT-4o Alpha -version, joka tukee jopa 64 000 tokenin tulostamista pyyntöä kohden, mikä vastaa 200-sivuista romaania.

Testaajat voivat käyttää GPT-4o:n pitkää lähtötoimintoa "gpt-4o-64k-output-alphasta".

Uuden mallin hinta on kuitenkin jälleen kerran asettanut uuden katon. Se maksaa 6 dollaria miljoonaa syöttötokenia kohden ja 18 dollaria miljoonaa lähtömerkkiä kohden.

Vaikka tuloste on 16 kertaa suurempi kuin GPT-4o, hinta on myös noussut 3 dollarilla.

Tällaisen vertailun jälkeen gpt-4o-mini on todellakin edullisempi!

Tutkija Simon Willison sanoi, että pitkää tulostusta käytetään pääasiassa tiedon muuntamisen käyttötapauksissa.

Jos esimerkiksi haluat kääntää asiakirjoja kielestä toiselle tai poimia asiakirjoista jäsenneltyä dataa, lähes jokaista syöttötunnusta on käytettävä tuloste-JSON:ssa.

Ennen tätä pisin hänen tuntemansa lähtömalli oli GPT-4o mini, joka oli 16 000 tokenia.

Miksi julkaista malli, jolla on pidempi tuotanto?

On selvää, että pidempi lähtö mahdollistaa GPT-4o:n kattavamman ja yksityiskohtaisemman vastauksen, mikä on erittäin hyödyllistä joissakin skenaarioissa.

Esimerkiksi koodin kirjoittaminen ja kirjoittamisen parantaminen.

Tämä on myös OpenAI:n käyttäjien palautteen perusteella tekemä säätö, jonka mukaan käyttötarpeen täyttämiseksi tarvitaan pidempään lähtösisältöä.

Ero kontekstin ja lähdön välillä

GPT-4o on tarjonnut julkaisustaan lähtien 128 kt:n enimmäiskontekstiikkunan. GPT-4o pitkälle ulostulolle suurin kontekstiikkuna on edelleen 128 kt.

Joten, miten OpenAI kasvattaa tulostettujen merkkien määrää 4 000:sta 64 000:een säilyttäen samalla 128 000 kokonaiskontekstiikkunan?

Tämä johtuu siitä, että OpenAI rajoitti alun perin tulostettavien merkkien määrän enintään 4 000 tunnukseen.

Tämä tarkoittaa, että käyttäjät voivat käyttää jopa 124 000 merkkiä syötteenä yhdessä vuorovaikutuksessa ja voivat saada enintään 4 000 lähtömerkkiä.

Tietenkin voit myös syöttää enemmän tokeneita, mikä tarkoittaa, että vähemmän tokeneita tulostetaan.

Loppujen lopuksi pitkän kontekstin pituus (128K) on kiinteä, riippumatta siitä, kuinka syöte muuttuu, tuloste ei ylitä 4000.

Nyt OpenAI rajoittaa lähtötunnisteen pituuden 64 000 merkkiin, mikä tarkoittaa, että voit tulostaa 16 kertaa enemmän tokeneita kuin ennen.

Loppujen lopuksi tuotanto on laskennallisesti intensiivisempaa ja hinnannousu on suurempi.

Vastaavasti uusimmassa GPT-4o minissä konteksti on myös 128K, mutta enimmäistulostus on nostettu 16 000 merkkiin.

Tämän jälkeen käyttäjät voivat syöttää jopa 112 000 merkkiä ja lopulta saada jopa 16 000 merkkiä tulosteena.

Yleensä OpenAI tarjoaa tässä ratkaisun rajoittaa syöttötunnusta saadakseen pidemmän vastauksen LLM:ltä sen sijaan, että laajennat suoraan kontekstin pituutta.

Mitä tulee muihin markkinoilla oleviin malleihin, pitkä on ylittänyt miljoonan (Gemini), ja hieman lyhyemmällä on 200 000 (Claude), ja OpenAI on edelleen täällä.

Tämä aiheuttaa myös vaikean ongelman kehittäjille: jos haluat syöttää enemmän, sinun on hyväksyttävä vähemmän, jos haluat enemmän tulosta, sinun on syötettävä vähemmän.

Kuinka mitata se riippuu siitä, kumman olet valmis uhraamaan...

Viitteet:

https://x.com/OpenAI/status/1818353580279316863

https://x.com/tsarnick/status/1818402307115241608

https://x.com/kimmonismus/status/1818409637030293641

https://www.reddit.com/r/singularity/comments/1eg51gz/chatgpt_advanced_audio_helping_me_pronouce/

https://venturebeat.com/ai/openai-launches-experimental-gpt-4o-long-output-model-with-16x-token-capacity/

uutiset

GPT-4o-versio "Her" on vihdoin täällä! Vitsit kertominen ja kissa miaukuminen, kuinka seksikäs tekoälytyttöystävä voi olla?

Johdanto

yhteystietoni