OpenAI yhtäkkiä päivitetty! GPT-4o lanseeraa edistyneen ääniversion, vastaa kysymyksiin sekunneissa, verkkovieraat ovat hulluja

OpenAI yhtäkkiä päivitetty! GPT-4o julkaisee edistyneen ääniversion, vastaa kysymyksiin sekunneissa, verkkovieraat ovat tulossa hulluiksi

2024-07-31

Älykkäät asiat (julkinen tili:zhidxcom）
kirjoittajavanilja
muokataLi Shuiqing

GPT-4o:n edistynyt äänitoiminto ei vihdoin ole enää "tulevaisuus"!

Uutisia Zhidongxista 31. heinäkuuta, aikaisin tänä aamuna,OpenAIIlmoitamme käyttöönoton alkamisesta pienelle ryhmälle ChatGPT Plus -käyttäjiäEdistynyt äänitila, joka perustuu GPT-4o:hon, joka tarjoaa luonnollisempia reaaliaikaisia keskusteluja.

▲OpenAI käynnistää edistyneen äänitilan

Mallin julkaisun jälkeen monet kutsun saaneet nettiläiset ovat jo aloittaneet sen pelaamisen ja jakaneet omia kokeiluvideoitaan ja tunteitaan. Tämä on esimerkiksi ChatGPT:n esittämä nopea rap- ja beatbox-kappale, joka kuulostaa varsin tyylikkäältä.

//oss.zhidx.com/uploads/2024/07/66a9902a60e1d_66a9902a5d0a5_66a9902a5d078_Beatbox.mp4

Kaiken kaikkiaan ChatGPT:n edistynyt äänitila ei eroa paljon alkuperäisestä virallisesta esittelystä.lähes viivytyksettä , eri sävyt ovat myös hyvin eloisia. Näyttää kuitenkin siltä, että se on toteuttanut monia suojatoimenpiteitä ChatGPT:n turvallisuuden suhteenMahdollisuus hylätä käyttäjien pyyntöjä on kasvanut。

ChatGPT:n äänikeskusteluominaisuus lanseerattiin ensimmäisen kerran viime vuoden syyskuussa.Tämän vuoden toukokuussa OpenAI lanseerasi aLippulaivamalli GPT-4o Edistyneempi versio puhevuoropuhelusta ja suoritti julkisen esittelyn. GPT-4o käyttää yhtä multimodaalista mallia puheominaisuuksille edellisen kolmen erillisen mallin sijaan, mikä vähentää viivettä keskusteluissa chatbottien kanssa. (OpenAI kaatoi ääniavustajan yössä! GPT-4o-malli on pelottavan voimakas, ChatGPT oppi lukemaan näyttöä, ja todellinen versio Heristä on täällä)

OpenAI ilmoitti tuolloin, että ominaisuus otetaan käyttöön ilmaisille ja maksullisille käyttäjille viikkojen kuluessa. Kuitenkin vain muutama päivä julkaisunsa jälkeen OpenAI:lla oli riita Scarlett Johanssonin kanssa, joka esittää "Black Widow" -elokuvaa "Avengers"-elokuvasarjassa ja tunnetaan fanien "leski sisarena" ChatGPT-äänen ansiosta. Mielenosoitus Linjat olivat liian samankaltaisia, ja Scarlett itse syytti häntä, ja netizens vastusti häntä voimakkaasti.

Myös Advanced Voice Moden julkaisupäivä on viivästynyt tämän vuoksi. Vaikka OpenAI väitti, että ChatGPT ei matkinut Scarlettin ääntä, äänilinja poistettiin myöhemmin.

1. Testaus yli sadan ulkopuolisen punaisen tiimin jäsenen kanssa, joka saattaa olla avoinna kaikille tilaajille syksyllä

GPT-4o-pohjainen edistynyt äänitila on tällä hetkellä saatavilla vain pienelle määrälle ChatGPT Plus -käyttäjiä ja se on saatavillaLuonnollisempaa reaaliaikaista keskustelua，Salli käyttäjien keskeyttää milloin tahansa, ja voiTunnista käyttäjien tunteet ja vastaa niihin。

Tähän Alpha-testiin osallistuvat käyttäjät saavat sähköpostin, jossa on ohjeet ja ilmoituksen ChatGPT-mobiilisovellukseensa. OpenAI sanoi, että se lisää jatkuvasti lisää käyttäjiä ja aikoo tuoda sen kaikkien Plus-tilaajien saataville syksyllä.

▲ Kutsusähköposti ja sovelluksen pääsivu

ChatGPT:n edistynyt äänitila julkaistiin tämän vuoden toukokuussa. Se perustuu OpenAI:n uuteen lippulaivamalliin GPT-4o, joka voi suorittaa äänikeskustelun ja reaaliaikaisen videovuorovaikutuksen, kuten ymmärtää lineaarisia yhtälöitä videokuvien avulla sekä ymmärtää ja arvioida ihmisten ilmaisuja. ja intonaatiot jne.

OpenAI kertoi, että sen alkuperäisestä julkaisusta lähtien tiimi on työskennellyt parantaakseen puhekeskustelujen turvallisuutta ja laatua ja testannut puheominaisuuksia yli 100 ulkoisen punaisen tiimin jäsenen kanssa 45 kielellä.

Yksityisyyden suojaamiseksi OpenAI puhui vain neljällä esiasetetulla äänellä mallia harjoittaessaan ja rakensi vastaavan järjestelmän erilaisten tulosteiden estämiseksi.

OpenAI aikoo jakaa yksityiskohtaisen raportin GPT-4o:n toimivuudesta, rajoituksista ja turvallisuusarvioinnista elokuun alussa.

2. Ensimmäinen kokeilukäyttäjien aalto alkoi elää täyttä elämää: harjoittelivat ranskaa, oppivat miau ja selittivät jalkapalloa.

Ensimmäiset kokeilukäyttäjät eivät malta odottaa, että pääsevät käyttämään edistynyttä äänitilaa ja jakamaan kokeilukokemuksensa.

Taiteilija Manuel Sainsily käynnistää kameran samallaLive ammuntaKysyin ChatGPT:ltä vasta kasvatetusta kissanpennustani ja sille järjestämästäni ympäristöstä, samalla kun kysyin ChatGPT:ltä sen mielipiteitä ruokinnasta.

//oss.zhidx.com/uploads/2024/07/66a9900fc37cb_66a9900fbde19_66a9900fbddf7_Videokeskustelu.mp4

ChatGPT:n vastaus oli periaatteessa viivyttelemättä. Ensin hän ylisti kissan söpöyttä erittäin ihastuttavalla äänellä ja lohdutti sitten Sainsilyä pyydettyään lisätietoja ja kehotti häntä olemaan huolissaan. Sainsily huudahtaa: "Tuntuu kuin olisi videopuhelu asiantuntevan ystävän kanssa."

Netizen Bergara jakoi Reddit-sosiaalisella alustalla, että ChatGPT hylkäsi kaikki hänen laulupyyntönsä eikä halunnut muuttaa ääntään. ChatGPT onnistui, kun hän pyysi sitä lausumaan runon eri tavoilla ja tunnelmissa, mutta kun sitä pyydettiin lausumaan se hymyillen, se kieltäytyi.

Esimerkiksi Bergara sanoi harjoittelevansa ranskaa ja pyysi ChatGPT:tä toimimaankielivalmentaja, kysyvät heidän mielipiteitään ääntämisestä.

//oss.zhidx.com/uploads/2024/07/66a9903094c84_66a99030913bd_66a990309139a_Ranskan opetus.mp4

Mitä tulee sanan Bergara ääntämiseen, ChatGPT antoi yksityiskohtaisia ehdotuksia stressistä, lopetusäänistä jne. ja esitteli. Samalla hänen opetustyylinsä on hyvin "kannustavaa koulutusta", ja hän kehuu epäröimättä Bergaran ääntämistä, mikä suoraan lisää emotionaalista arvoa.

Bergara antaa ChaGPT:n käyttää sitä erikseenUjo, vihainen sävy Kerro vitsejä oluesta. ChatGPT:n käsitys ujoudesta on lausua se hengittävällä äänellä, ja vihan ilmaisussa se lisää desibeleitä.

//oss.zhidx.com/uploads/2024/07/66a990398daca_66a9903989c33_66a9903989c08_Vitsien kertominen ujossa ja vihaisessa sävyssä.mp4

Kun ChatGPT:tä pyydetään käyttämäänsurullinen sävyRunoutta lausuessa kuulostaa siltä, että se katkeaa...

//oss.zhidx.com/uploads/2024/07/66a9902fc3720_66a9902fbc252_66a9902fbc230_sad tone.mp4

Bergara sanoi, että ChatGPT on toistaiseksi testeissä käyttäytynyt samalla tavalla kuin OpenAI on osoittanut, muttaHylkäysprosentti näyttää hieman korkealta, hän arveli, että se voisi johtua turvallisuussyistä.

Esimerkiksi kun Bergara pyysi ChatGPT:tä laulamaan tarinan roboteista ja rakkaudesta, se sanoi, että se voisi kertoa tarinan, mutta vain normaalilla puheäänellä.

//oss.zhidx.com/uploads/2024/07/66a99036460bb_66a9903642127_66a99036420ff_Emotional storytelling.mp4

ChatGPT:n tarinankerron aikana Bergara keskeytti useita kertoja ja pyysi sitä "lisäämään enemmän tunteita". ChatGPT noudatti vaatimuksia, ja sen sävy muuttui hitaammaksi ja animoidummaksi.

Jotkut verkkokäyttäjät ovat jo alkaneet käyttää ChatGPT:tä elämänsä järjestämiseen.

Squadin perustaja ja teknologiajohtaja Ethan Sutin antaa ChatGPT:njäljitteli erilaisia kissan miaukuja . Minun on sanottava, että tämä kissan kutsu on vähän "maaginen", mutta se näyttää olevan melko todellista, koska kissani oli kiinnostunut siitä...

//oss.zhidx.com/uploads/2024/07/66a9901c00939_66a9901bf0c77_66a9901bf0c51_Opi meow.mp4

ChatGPT:llä näyttää myös olevanmusiikkiesitys Kyky. Sutin pyysi häntä soittamaan c-molli sointua.

//oss.zhidx.com/uploads/2024/07/66a9903dcfec1_66a9903dcbf91_66a9903dcbf62_chord.mp4

Netizen Cristiano Giardina antoi ChatGPT:n pelatajalkapallo-ottelun kommentaattori . Hän jakoi joitain ensivaikutelmia edistyneen puhetilan kokeilemisesta: se on erittäin nopea, tuottaa aina mielenkiintoisia tuloksia ja siinä on aina amerikkalainen aksentti puhuessaan muita kieliä.

//oss.zhidx.com/uploads/2024/07/66a9988d2ea93_66a9988d279ea_66a9988d279c4_football commentary.mp4

Netizen Kesku pyysi ChatGPT:tä sanomaan yhden asianolematon kieli ja selitä sitten, miten kieli toimii. ChatGPT loi Glimnarin, äänipohjaisen kielen, joka kuulostaa vähän laulamiselta.

//oss.zhidx.com/uploads/2024/07/66a998835c09b_66a9988357da7_66a9988357d83_Creation Language.mp4

Vaikka ChatGPT:n edistynyttä äänitilaa käyttää edelleen vain muutama käyttäjä, sen push-alueen laajeneessa voimme ehkä nähdä mielenkiintoisempia pelattavuutta ja kokemuksia.

Johtopäätös: OpenAI lisää tietoisuutta tekoälyn turvallisuudesta

Äänen ja videon tekoälyä tutkitaan sen kykyä toimia petostyökaluna. Vaikka OpenAI:n puhetila ei tällä hetkellä salli uusien äänien tai äänikloonien luomista, tila voi silti aiheuttaa sekaannusta.

Kevään päivityksen jälkeisten kuukausien aikana OpenAI on julkaissut useita uusia artikkeleita turvallisuudesta ja tekoälymallien yhdenmukaistamisesta. Tämä tapahtuu sen jälkeen, kun sen Super Alignment -tiimi hajotettiin, ja jotkut entiset ja nykyiset työntekijät kritisoivat painopisteensä siirtämisestä uusien tuotteiden lanseeraamiseen turvallisuuden sijaan. Tällä hetkellä edistyneiden puhemoodien käyttöönoton hidastuminen näyttää olevan merkki käyttäjille, sääntelijöille ja lainsäätäjille siitä, että OpenAI ottaa turvallisuuden vakavasti.

ChatGPT:n edistyneen puhetilan julkaisu myös erottaa OpenAI:n entisestään kilpailijoista, kuten Meta's Llama 3.1 -mallista ja Anthropic's Claude 3:sta, mikä asettaa paineita tunnepuheeseen keskittyville AI-aloitusyrityksille.

uutiset

OpenAI yhtäkkiä päivitetty! GPT-4o julkaisee edistyneen ääniversion, vastaa kysymyksiin sekunneissa, verkkovieraat ovat tulossa hulluiksi

Johdanto

yhteystietoni