uutiset

Verrattuna GPT-4o:han, Herin iFlytek Spark -versio on täällä ja on täysin auki elokuun lopussa.

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Uutisia 19. elokuuta, HKUSTiFlytekIlmoittaakipinäSuuri äänimallipäivitys, julkaistu virallisesti SparkissaÄärimmäinen nopeusohittaahenkilöitymäolla vuorovaikutuksessa ja soveltaa sen ominaisuuksia iFlytek Spark APP:n "XiaoXing Chat" -toimintoon, joka avataan yleisölle elokuun lopussa.


Virallisista näyttötuloksista päätellen Spark Extreme Super Anthropomorphic Interaction on saavuttanut läpimurtoja neljässä suhteessa: vaste- ja keskeytysnopeus, tunteiden havainnointi ja tunneresonanssi, ääniohjattava ilmaisu ja ihmisen roolipelit.

Mitä tulee vastenopeuteen, Xinghuo Extremely Fast Super Anthropomorphic Interaction tukee useita vuorovaikutuskierroksia, ja vastenopeus on yhtä nopea kuinGPT-4o Melko sopusoinnussa ihmisten normaalin chat-rytmin kanssa. Käyttäjät voivat keskeyttää tai puuttua keskusteluun milloin tahansa, ja järjestelmä voi vastata nopeasti, mikä saa aikaan todella saumattoman keskustelukokemuksen.

Tunnehavainnon ja emotionaalisen resonanssin suhteen Xinghuo Extreme Super Anthropomorphic Interaction pystyy tunnistamaan käyttäjän erilaisia ​​tunteita, kuten onnea, vihaa, surua, iloa jne., ei vain päätellen äänen sisällöstä, vaan myös vastaamalla sopivilla tunteilla. Lisäksi järjestelmä pystyy tunnistamaan myös ei-verbaaliset äänet, kuten yskimisen ja lemmikkiäänet, ja antaa vastaavat vastaukset.

Mitä tulee puheohjattavaan ilmaisuun, verrattuna aikaisempaan tilanteeseen, jossa koneen ääntä ei voitu säätää puhevuorovaikutuksessa, nyt niin kauan kuin ääni antaa ohjeita, super-antropomorfia voidaan ohjata muuttamaan ilmaisuja, kuten tunteita, tyyli, murre, intensiteetti jne.

Mitä tulee "roolipeleihin", se tukee erilaisia ​​roolisimulaatioita ja voi vaihtaa rooleja käyttäjien tarpeiden mukaan, mikä tekee keskustelusta mielenkiintoisemman ja interaktiivisemman.

On raportoitu, että iFlytek käyttää yhtenäistä hermoverkkoa päästä-päähän puhe-puhe-mallinnuksen toteuttamiseen, mikä yksinkertaistaa perinteistä puhevuorovaikutusta puheen tekstiksi, laajan mallin sukupolven vastaus- ja puhesynteesiprosesseja, mikä lyhentää vastetta merkittävästi. aikaa ja vuorovaikutuksen persoonallisuuden ja sujuvuuden parantamista. Lisäksi moniulotteisen ääniattribuuttien erotuskoulutuksen avulla järjestelmä voi joustavammin ohjata sisältöä, sointia, tunteita ja muita elementtejä vastaamaan erilaisia ​​skenaarioita ja tarpeita.

iFlytek sanoi, että Spark Extreme Super Human Interaction on täysin avoinna käytettäväksi elokuun loppuun mennessä, ja aikoo jatkaa interaktiivisten toimintojen ja tilojen laajentamista tulevaisuudessa tarjotakseen käyttäjille monipuolisempia ja käytännöllisempiä älykkäitä puhepalveluita. Teknologian kypsyessä ja sovellusskenaarioiden laajentuessa älykkään puhetekniikan odotetaan tuovan räjähdysmäistä kasvua monilla aloilla, kuten älypuhelimissa ja älyautoissa. IDC:n ennusteiden mukaan maailmanlaajuiset älypuhepalvelumarkkinat saavuttavat vuoteen 2030 mennessä noin 73,16 miljardia dollaria, ja vuotuinen kasvuvauhti on 27 %. (suolainen)

Tämä artikkeli on peräisin NetEase Technology Reportista. Saat lisätietoja ja perusteellista sisältöä seuraamalla meitä.