uutiset

OpenAI ottaa käyttöön edistyneen äänitilan joillekin ChatGPT Plus -käyttäjille

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

· Uusien ääniominaisuuksien avulla käyttäjät voivat puhua ChatGPT:lle ja saada reaaliaikaisia ​​vastauksia välittömästi tai keskeyttää ChatGPT:n puhumisen. Kehittyneemmät ominaisuudet, kuten videon ja näytön jakaminen, otetaan käyttöön myöhemmin.

31. heinäkuuta OpenAI ilmoitti edistyneen äänitilan käynnistämisestä joillekin ChatGPT Plus -käyttäjille ja aikoo avata sen kaikille ChatGPT Plus -käyttäjille syksyllä.

OpenAI ajaa uuden sukupolven tekoälyn ääniavustajien kehitystä. Uuden ääniominaisuuden avulla käyttäjät voivat puhua ChatGPT:lle ja saada reaaliaikaisia ​​vastauksia välittömästi sekä keskeyttää ChatGPT:n sen puhuessa. Puhemallit erottavat puheen eri intonaatioiden välittämän tiedon. Se kuulostaa luonnollisemmalta ja käyttää ääntä välittämään erilaisia ​​tunteita.

Uusi puhetila saa virtansa OpenAI:n GPT-4o-mallista, joka yhdistää puhe-, teksti- ja näköominaisuudet. Palautteen keräämiseksi OpenAI ottaa aluksi puheen premium-ominaisuuksia käyttöön ChatGPT Plus:n "pienelle käyttäjäryhmälle", mutta OpenAI sanoo, että se on kaikkien ChatGPT Plus -käyttäjien saatavilla tänä syksynä.

OpenAI viivästytti äänipuhelukokemuksen käynnistämistä kesäkuun lopusta heinäkuuhun sanoen, että julkaisustandardien täyttäminen vie aikaa. OpenAI sanoi, että se on testannut GPT-4o:n puheominaisuuksia yli 100 ulkoisen punaisen tiimin kanssa, jotka kattavat 45 kieltä. Yhtiö sanoi, että se on rakentanut useita suojamekanismeja, kuten yksityisyyden suojaamiseksi ja mallin käytön estämiseksi luomaan syvää fake-ääntä. Se työskenteli ääninäyttelijöiden kanssa luodakseen neljä esiasetettua ääntä .

Kun OpenAI lanseerasi ensimmäisen kerran GPT-4o:n, se kohtasi vastareaktion "Sky"-äänen käyttämisestä, joka kuulosti paljon näyttelijä Scarlett Johanssonilta. Scarlett Johansson on antanut lausunnon, jonka mukaan OpenAI otti häneen yhteyttä saadakseen mallin käyttämään ääntään, mutta hän kieltäytyi. OpenAI kiisti sen olevan Johnsonin ääni, mutta on keskeyttänyt Skyn ​​käytön.

OpenAI sanoi myös, että se on ottanut käyttöön suodattimia tunnistaakseen ja estääkseen pyynnöt luoda musiikkia tai muuta tekijänoikeudella suojattua ääntä, ja on soveltanut samoja suojausmekanismeja kuin tekstimalleissa GPT-4o:ssa estääkseen niitä rikkomasta lakeja ja luomasta haitallista sisältöä. "Meillä on suojakaiteet väkivaltaista tai tekijänoikeuksilla suojattua sisältöä koskevien pyyntöjen estämiseksi. Lisäksi edistyneemmät ominaisuudet, kuten videon ja näytön jakaminen, otetaan käyttöön myöhemmin."