uutiset

openai julkaisee täysin ihmismäisen chatgpt-ääniavustajan, joka osaa puhua 50 kieltä, mukaan lukien kiina

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

tämän artikkelin kirjoittaja: li dan

lähde: hard ai

neljä kuukautta openai:n ensimmäisen julkisen julkaisun jälkeen chatgpt:n ihmisen kaltainen kehittynyt tekoäly (ai) -ääniavustaja on vihdoin maksavien käyttäjien saatavilla.

tiistaina, 24. syyskuuta, itäistä aikaa, openai ilmoitti, että kaikki käyttäjät, jotka maksoivat openai chatgpt plus - ja team -pakettien tilaamisesta, voivat käyttää uutta chatgpt advanced voicea. tämä ominaisuus otetaan asteittain käyttöön seuraavassa muutaman päivän ja se on ensin saatavilla yhdysvaltain markkinoilla on verkossa. ensi viikolla ominaisuus on saatavilla openai edu- ja enterprise-pakettien tilaajille.

tämä tarkoittaa, että tällä viikolla sekä chatgpt:n plus-version yksittäiset käyttäjät että teams-version pienyritysten käyttäjät voivat ottaa uuden ääniominaisuuden käyttöön yksinkertaisesti puhumalla ilman, että sinun tarvitsee kirjoittaa kehotteita manuaalisesti ja käydä gpt-keskusteluja. kun käyttäjä käyttää sovelluksen edistynyttä äänitilaa, hän voi tietää, että hän on siirtynyt edistyneeseen puheavustajaan ponnahdusikkunan kautta, ja käyttäjä saa ilmoituksen sovelluksesta.

openai on antanut chatgpt:n uudelle ääniversiolle kaksi toimintoa, joista toinen on "muokattujen ohjeiden" tallentaminen ääniavustajalle, ja toinen on "muisti"-toiminto, joka muistaa, mitä toimintaa käyttäjä haluaa ääniavustajan suorittavan, vastaavanlainen. mitä openai antoi chatgpt:lle tämän vuoden huhtikuussa tekstiversio esittelee muistitoiminnon. käyttäjät voivat hyödyntää näitä ominaisuuksia varmistaakseen, että äänimallit ovat henkilökohtaisia, jolloin tekoälyavustaja voi vastata käyttäjän mieltymysten mukaan kaikissa keskusteluissa.

openai julkaisi tiistaina viisi uutta erityylistä ääntä, nimeltään arbor, maple, sol, spruce ja vale, sekä neljä ääntä breeze, juniper, cove ja ember, jotka on julkaistu aiemmin äänitilan vanhassa versiossa, valinnaiset äänet saavutetaan yhdeksän tyyppiä. openai parantaa myös keskustelun nopeutta, sujuvuutta ja aksenttia joillakin vierailla kielillä.

openai esitteli, että edistynyt ääniavustaja osaa sanoa "anteeksi, olen myöhässä" 50 kielellä, ja liitti sosiaalisen median viestiin videon osoittaakseen, että käyttäjä voi pyytää ääniavustajaa ilmaisemaan isoäidille, koska hän on odottanut pitkään anteeksi. videolla näkyy, että tekoälyassistentti tiivisti ensin sen, mitä käyttäjä halusi ilmaista, ja sanoi sen englanniksi. sitten kun käyttäjä kehotti tekoälyä puhumaan vain mandariinia, tekoälyassistentti puhui sen uudelleen kielellä. tavallinen mandariini.

uusi ääniominaisuus on saatavilla openai:n tekoälymalliin gpt-4o, ei äskettäin julkaistuun esikatselumalliin o1.

uuden äänitoiminnon julkaisu on odotettu pitkään. wall street news mainitsi kerran, että tämän vuoden toukokuussa openai esitteli äänitilaa voice mode, kun se lanseerasi uuden lippulaivamallinsa gpt-4o. gpt-4o:n tuolloin tukema chatgpt-ääni kuulosti aikuiselta amerikkalaiselta naiselta ja pystyi vastaamaan pyyntöihin välittömästi. kun se kuuli demon openai-tutkimuksen johtajan mark chenin hengittävän liikaa, se tuntui hermostuneen ja sanoi sitten: "mark, sinä et ole pölynimuri", käski cheniä rentoutua ja hengittää.

openai suunnitteli alun perin käynnistävänsä äänitilan pienelle ryhmälle plus-paketin käyttäjiä kesäkuun lopussa, mutta ilmoitti kesäkuussa, että julkaisu viivästyy yhdellä kuukaudella varmistaakseen, että ominaisuus pystyy käsittelemään miljoonien käyttäjien pyyntöjä turvallisesti ja tehokkaasti. . openai ilmoitti tuolloin aikovansa tuoda ominaisuuden kaikkien plus-käyttäjien saataville tänä syksynä. tarkka aikataulu riippuu korkeiden sisäisten turvallisuus- ja luotettavuusstandardien täyttämisestä.

heinäkuun lopussa openai lanseerasi chatgpt:n edistyneessä äänitilassa rajoitetulle määrälle maksullisia plus-käyttäjiä sanoen, että äänitila ei voi jäljitellä muiden puhumista, ja lisäsi uusia suodattimia varmistaakseen, että ohjelmisto voi löytää ja hylätä tietyn luodun musiikin. tai muilla tekijänoikeudella suojatun äänen pyynnöillä. uudesta äänitilasta puuttuu kuitenkin monia openai:n toukokuussa osoittamia ominaisuuksia, kuten tietokonenäköominaisuudet. tämän ominaisuuden avulla gpt voi antaa äänipalautetta käyttäjän tanssiliikkeistä yksinkertaisesti käyttämällä älypuhelimen kameraa.