Älä keskity vain Herin ChatGPT-versioon, vaan myös kotimaiset pelaajat ovat kiinnostuneita multimodaalisesta tekoälystä antropomorfisesta vuorovaikutuksesta

Älä keskity vain Herin ChatGPT-versioon. Kotimaiset pelaajat ovat myös kiinnostuneita monimuotoisesta AI-antropomorfisesta vuorovaikutuksesta.

2024-07-31

Koneen sydän alkuperäinen

Kirjailija: Du Wei

Kuinka pitkälle tekoäly on nykyään ihmisten tunteiden tunnistamisessa? Tämän kuun alussa päättyi tunnepitoisemman tekoälyn haastava korkean profiilin kilpailu!

Tämä onToinen multimodaalinen tunteiden tunnistamisen haaste (MER24), sen sponsoroivat yhdessä professori Tao Jianhua Tsinghuan yliopistosta, Lian Zheng Kiinan tiedeakatemian automaatioinstituutista, Björn W. Schuller Imperial Collegesta, Zhao Guoying Oulun yliopistosta ja Erik Cambra Nanyangin teknillisestä yliopistosta. huipputekoälykonferenssissa IJCAI2024 tutkiaksesi tekstin käyttöä. Käytä multimodaalista dataa, kuten ääntä ja videota, tekoälyn tunteiden tunnistamiseen ja edistä vastaavien teknologioiden käyttöä todellisissa ihmisen ja tietokoneen vuorovaikutusskenaarioissa.

Kilpailun virallinen verkkosivusto: https://zeroqiaoba.github.io/MER2024-website/#organization

Tässä haasteessa on yhteensä kolme raitaa, nimittäin Semi (puolivalvottu oppimisrata), Noise (kohinan kestävyysraita) ja Ov (avoimen sanaston tunteidentunnistusraita), joista yksi onSemi-radalla on eniten osallistuvia joukkueita, se on vaikein ja kilpailun tiukimmat.。

Esimerkkinä Semi-rata, osallistuvien tiimien on käytettävä pieni määrä merkittyä ja suurta määrää merkitsemätöntä datavideodataa omien malliensa kouluttamiseen ja arvioitava mallin suorituskykyä ja yleistyskykyä merkitsemättömässä tietojoukossa. Avain tämän kappaleen voittamiseen on parantaa mallin tunteiden tunnistusta parantamalla puolivalvottua oppimistekniikkaa, kuten tunneluokkien ennustamisen tarkkuutta.

Kilpailun alkamisesta toukokuussa, kahden kuukauden sisällä, on kilpaillut lähes sata joukkuetta eri puolilta maailmaa, mukaan lukien tunnettuja yliopistoja ja innovatiivisia yrityksiä.sisäänSemi-radan ykköspaikan voitti sosiaalinen alusta Soul App, sen puheteknologiatiimi nousi ykköseksi toteuttamiskelpoisilla ja innovatiivisilla teknisillä ratkaisuillaan.

Ennen kuin paljastamme Soul-tiimin teknisen ratkaisun, meidän on kuitenkin ensin ymmärrettävä tekoälyn tunteiden tunnistusominaisuudet useissa eri muodoissa.

Seuraava askel ihmisen ja tietokoneen vuorovaikutuksessa

Anna tekoälyn ymmärtää tunteita

Nykypäivän tekoäly näyttää olevan kaikkivoipa, mukaan lukien keskusteluviestintä, kuvien tai videoiden luominen, matemaattisten ongelmien ratkaiseminen jne. Se kykenee erilaisiin tehtäviin, kuten havainnointiin, oppimiseen, päättelyyn ja päätöksentekoon. Suurten mallien siunauksen ansiosta tekoälyä voidaan sanoa riittävän älykkääksi, mutta siltä puuttuvat tunnenäkökohdat, kuten empatia.

Ihmisen ja tietokoneen välisessä vuorovaikutuksessa käyttäjät eivät toisinaan tarvitse tekoälyä vain noudattamaan ohjeita ja suorittamaan tehtäviä, vaan niiden on myös tarjottava riittävästi tunnearvoa emotionaalisten tarpeiden tyydyttämiseksi. Toiminnallisista "perustaidoista" emotionaalisiin "edistettyihin taitoihin" taitoja, jotka tekoäly tarvitsee hallita, on päivitettävä.

Siksi multimodaalisesta tunteiden tunnistamisesta on tullut aktiivinen tutkimusaihe tekoälyn alalla. Tekoäly, joka osaa lukea ja välittää tunteita, on tullut uusi kuuma aihe alalla, ja sitä pidetään seuraavana suurena läpimurtona tekoälyn alalla. Viimeisen kuuden kuukauden aikana jotkut tekoälyyritykset ja teollisuuden jättiläiset ovat paljastaneet meille uusia mukaansatempaavia muotoja ihmisen ja koneen välisestä vuorovaikutuksesta.

Huhtikuun alussa ulkomainen startup-yritys Hume AI julkaisi puhekeskustelurobotin, Empathetic Voice Interfacen (EVI), joka analysoi ja tunnistaa keskustelukumppanin sävyn ja tunteet puheviestinnän avulla ja pystyy havaitsemaan jopa 53 tunnetta. Lisäksi se voi simuloida erilaisia tunnetiloja, mikä tekee vuorovaikutuksesta lähempänä oikeita ihmisiä. Tekoälyn tunnetason läpimurtojen ansiosta startup sai nopeasti 50 miljoonaa dollaria B-sarjan rahoitusta.

Seuraava on OpenAI:n suuri siirto. Lippulaivamalli GPT-4o esittelee reaaliaikaisia ääni- ja videopuhelutoimintoja. Se on nimeltään ChatGPT-versio "Her". lähitulevaisuudessa. Siitä lähtien tekoäly on kehittänyt voimakasta kaunopuheisuutta ja kykyä havaita tunteita, minkä vuoksi ihmiset kutsuvat sitä tieteiskirjallisuuden aikakauden saapumiseksi.

Kotimaiset yritykset, kuten Microsoft Xiaoice ja Lingxin Intelligence, ovat myös sitoutuneet luomaan tunneperäisiä tekoälytuotteita. Voimme nähdä trendin: tunteiden tunnistusominaisuudet ovat yhä enemmän mukana multimodaalisissa tekoälysovelluksissa, kuten tekstissä, äänessä ja videossa. Kuitenkin, jos haluamme mennä pidemmälle antropomorfisen tunteentunnistuksen alalla, meidän on edelleen ratkaistava ongelmia, kuten leimatun tiedon niukkuus ja subjektiivisen tunteentunnistuksen epävakaus ja epätarkkuudet.

Siksi on tullut erityisen tarpeelliseksi kannustaa akateemista yhteisöä ja teollisuutta kiinnittämään enemmän huomiota multimodaalisen tunteiden tunnistamisen alaan ja nopeuttamaan siihen liittyvien teknologioiden innovaatiota ja kehitystä. Tällä hetkellä huippuakateemiset AI-konferenssit, kuten ACM MM ja AAAI, pitävät affektiivista tietojenkäsittelyä tärkeänä tutkimusaiheena Huippukonferenssit, kuten CVPR ja ACL, ovat myös pitäneet affektiiviseen laskemiseen liittyviä haasteita. Erityisesti big datan ja suurten mallien aikakauden tullessa käyttöön suuren määrän leimaamatonta dataa ja tehokasta eri modaalisen tiedon prosessointia ja integrointia multimodaaliseen tunteidentunnistukseen on alan tällä hetkellä suuri haaste. Tämä MER24 Challenge pidettiin Tämä on myös syy ja merkitys.

Soul-tiimi voitti Semi-radan ykköspaikan kykynsä kerryttämisen ja innovaation ansiosta multimodaalisen datan ymmärtämisessä, tunteidentunnistusalgoritmeissa, mallin optimointialustan työkaluissa, sisäisessä työnkulun rakentamisessa jne. sekä teknisen tiimin tehokkaasta yhteistyöstä. .

Voitti ykköspaikan vaikeimmalla radalla

Mitä Soul-tiimi teki?

Koska mainitaan, että puolirata on vaikein, mitkä ovat vaikeita puolia? Ja miten Team Soul sai ykköspaikan? Katsotaan alas.

Data on yksi kolmesta tekoälyn pääelementistä Ilman riittävää, varsinkin korkealaatuista datakoulutusta, malli ei voi taata hyvää suorituskykyä. Tietojen niukkuudesta johtuvien haasteiden edessä alan ei tarvitse vain laajentaa kaikentyyppistä dataa, mukaan lukien tekoälyn tuottamaa dataa, vaan myös keskittyä mallien yleistämiskyvyn parantamiseen niukassa datassa. Sama pätee multimodaalisiin tunteiden tunnistustehtäviin. Sen ydin on massiivisen etikettidatan tukeminen. Erityyppisiä sisältöjä, kuten tekstiä, ääntä ja videota, voidaan merkitä tunneilla, kuten ilolla, vihalla, surulla ja ilolla. surua. Tosiasia on, että emotionaalisesti merkittyä dataa Internetissä on hyvin vähän.

Tämän kilpailun puolirataVain 5030 kappaletta merkittyjä tietoja tarjotaan, ja loput 115595 kappaletta ovat nimeämättömiä tietoja. . Siksi merkittyjen tietojen niukkuus on tullut kaikkien osallistuvien tiimien, myös Soul-tiimin, ensimmäinen ongelma.

Kuvan lähde: MER24 peruspaperi: https://arxiv.org/pdf/2404.17113

Toisaalta Noise- ja Ov-raitoihin verrattuna Semi-raita keskittyy ydinrunkoteknologian testaamiseen eli kiinnittää enemmän huomiota malliarkkitehtuurin valintaan ja ominaisuuspoiminnan yleistysominaisuuksiin sekä monitoimien keräämiseen ja innovaatioon. modaalinen suuri malliteknologia Seksuaaliset vaatimukset ovat suhteellisen korkeat.

Ottaen huomioon radan ominaisuudet, joissa on vähemmän merkittyjä tietoja ja korkeat tekniset vaatimukset, Soul-tiimi teki riittävästi kilpailua edeltäviä valmisteluja itse kehitetyn suuren mallin joihinkin aiemmin kertyneen moduulin perusteella ja määritti joukon toteuttamiskelpoisia innovatiivisia teknisiä ratkaisuja. Yleinen ajatus on omaksua "ensin päärunko ja sitten hienosäätö" -strategia, jossa keskitytään ensin kunkin ydinominaisuuden poimintamallin yleistämiseen ja sitten integroimaan ne yhteen tietyn toteutusprosessin aikana, seuraavat työn osat olemme valmiit. Nämä muodostavat heidän ydinvahvuutensa.

Ensinnäkin keskity multimodaalisten ominaisuuksien poimimiseen varhaisessa vaiheessa. End-to-end -malliarkkitehtuurissa esikoulutettuja malleja käytetään poimimaan tunnerepresentaatioita tekstin, puheen ja näkemyksen eri modaaleissa kiinnittäen huomiota tunteiden yhteisiin ja eroihin, mikä parantaa tunteiden tunnistusvaikutusta. Myöhemmin ehdotetaan tehokasta fuusiomenetelmää, joka perustuu useiden modaliteettien kunkin modaliteetin ominaisuuksiin, ja nämä moduulit yhdistetään muodostamaan malliarkkitehtuuri. Parantaakseen esikoulutetun mallin yleistyssuorituskykyä Soul-tiimi ehdotti EmoVCLIP:iä ensimmäistä kertaa tunneiden tunnistamisen alalla erityisesti videomodaliteeteille parempi yleistyssuorituskyky videon tunteiden tunnistamisen alalla.

Lisäksi parantaakseen tekstimodaliteetin tunteiden tunnistuskykyä Soul-tiimi käyttää GPT-4:ää luodakseen emotionaalisia pseudotunnisteita tekstimodaliteeteille hyödyntäen täysimääräisesti GPT-4:n emotionaalista huomiokykyä parantaakseen tunteiden tunnistamisen tarkkuutta tekstimuodot, tulevaisuutta varten Parempi perusta on luotu liikennemuotojen yhdistämiselle.

Toiseksi, mitä tulee multimodaalisiin ominaisuuksiin, Soul-tiimi käytti ensimmäistä kertaa Modality Dropout -strategiaa multimodaalisen tunteentunnistuksen suuntaan ja tutki erilaisten keskeyttämismäärien suorituskykyä helpottaakseen välistä kilpailuongelmaa modaliteetit mallin koulutusprosessin aikana Tukahduta satunnaisesti tietty modaliteetti (teksti-, puhe- tai videomodaalisuus) saavuttaaksesi paremman kestävyyden ja parantaaksesi mallin yleistyskykyä näkymättömissä tiedoissa toimitettujen merkittyjen tietojen lisäksi.

Lopuksi puolivalvottu oppimistekniikka tulee peliin. Perusideana on käyttää merkittyä dataa mallin kouluttamiseen, sitten ennustaa leimaamaton data ja luoda pseudotunnisteet leimaamattomille tiedoille ennustustulosten perusteella. Näitä pseudomerkkejä käytetään mallin kouluttamiseen ja mallin vaikutuksen jatkuvaan parantamiseen. Soul-tiimi käytti itseharjoittelustrategiaa puolivalvotussa oppimisessa pseudotunnisteiden lisäämiseksi syklisesti yli 110 000 merkitsemättömään Semi-radan dataan ja lisäsi ne harjoitussarjaan, ja päivitti mallia iteratiivisesti saadakseen lopullisen mallin.

Soul-joukkueen tekninen suunnitelma kilpailua varten.

Soul-tiimin tekniset ratkaisut ovat tuoneet hyviä tuloksia kokonaisideasta multimodaalisten ominaisuuksien fuusioimiseen, kontrastiiviseen oppimiseen ja merkitsemättömään datan itsekoulutukseen.vihdoinkinÄänen, näön ja tekstin multimodaalisen tunteentunnistuksen tarkkuuden osalta Soul-tiimin ehdottama järjestelmä parani 3,7 % perusjärjestelmään verrattuna ja oli yli 90 %. . Samalla Soul-tiimi osaa myös paremmin erottaa tunteet, joilla on hämmentäviä rajoja tunteiden tunnistamisen alalla (kuten huoli ja huoli).

Kuvan lähde: MER24 peruspaperi: https://arxiv.org/pdf/2404.17113

Syvemmästä näkökulmasta katsottuna Soul-tiimin menestys MER24 Challenge -haasteessa on keskittynyt osoitus sen syvällisestä AI-suurmalliteknologian viljelystä sosiaalisella alalla, erityisesti sen multimodaalisen tunnevuorovaikutuksen kyvyissä.

Innovatiivinen multimodaalinen antropomorfinen vuorovaikutus

Sosiaalinen tekoäly on seuraava taso

Sosiaalinen ala vaatii luonnollisesti emotionaalista tekoälyä. Valtavirran näkemys on, että sosiaalisen vuorovaikutuksen ydin on tunnearvojen vaihto ja tunteet ovat erilaisia. Tämä tarkoittaa, että jos tekoäly haluaa integroitua saumattomasti sosiaalisiin kohtauksiin ja toimia tehokkaasti, sen on tarjottava runsasta tunnepalautetta ja kokemusta oikeiden ihmisten tavoin.

Empaattisen tekoälyn toteuttamisen perustana on tehokkaat multimodaaliset tunteiden tunnistusominaisuudet ja kehittyminen yksinkertaisesta "tehtävän suorittajasta" "ihmisen tunnetarpeita vastaavaksi seuralaiseksi". Tekoälyn on kuitenkin edelleen hyvin vaikeaa ymmärtää tehokkaasti tunteita. Se eroaa olennaisesti ihmisistä kontekstin ymmärtämisen, emotionaalisen palautteen antamisen ja ajattelun suhteen.

Soulille, joka on juurtunut sosiaaliseen alaan, keskittymisestä emotionaalisten kykyjen avulla tapahtuvaan tekoälyn rakentamiseen on tullut tärkeä ehdotus, jota on harkittava. Vuonna 2016 lanseerattuaan Soul ajatteli ensin, kuinka käyttää innovatiivisia teknologioita ja tuotteita vastaamaan paremmin käyttäjien tarpeisiin. Tekoälyn käyttöönotosta ihmisten yhteydenpitotarpeen ratkaisemiseksi on tullut avain sen jalansijalle sosiaalialalla ja sen kehityksessä. Aiemmin lanseerattu "Lingxi Engine" käyttää älykkäitä suositusalgoritmeja käyttäjien kiinnostuksen kohteiden karttojen ja sivuston kaikkien skenaarioiden ominaisuuksien louhimiseen ja analysoimiseen, mikä helpottaa ihmisten löytämistä, joiden kanssa he voivat keskustella, ja lisää tarvitsemaansa sisältöä. erittäin tahmea käyttäjä- ja sisältöekologia. Toistaiseksi sovitusskenaariot, joissa tätä "älykkäämpää" algoritmia käytetään, ovat myös yksi Soul-käyttäjien erittäin aktiivisista ominaisuuksista.

Varhaisen tekoälyavusteisen sosiaalisen vuorovaikutuksen onnistuneen kokemuksen ansiosta tässä suurten mallien nopean kehityksen teknologisessa aallossa Soul tutkii edelleen uusia mahdollisuuksia ihmisen ja tietokoneen väliseen vuorovaikutukseen, joka perustuu tekoälyn osallistumiseen sosiaaliseen vuorovaikutukseen ja avustettuihin suhdeverkostoihin.

Siitä lähtien, kun AIGC:hen liittyvä algoritmitutkimus ja -kehitys käynnistettiin vuonna 2020, Soul on ottanut suunnakseen multimodaalisuuden ja kerännyt huippuluokan kykyjä älykkääseen dialogiin, kuvan luomiseen, äänen ja musiikin luomiseen jne.Verrattuna uusiin puhtaasti teknisiin tekoälyn yrittäjävoimiin, Soulin tärkein ominaisuus on, että se ottaa käyttöön "malli-vaste-integraatio" -strategian edistääkseen samanaikaisesti suuria malleja ja AIGC-sovelluksia C-puolella.Keskity tekoälyn rakentamiseen tunteidentunnistusominaisuuksien avulla, jotta saat todella lämmintä palautetta runsaissa antropomorfisissa vuorovaikutusskenaarioissa。

Soulin toimista kahden viime vuoden aikana voidaan nähdä, että se on kiihdyttänyt sosiaalisia skenaarioita voimaannuttavaa AIGC:tä. Vuonna 2023 lanseerataan Soul X, suuri itse kehitetty kielimalli, josta tulee tärkeä infrastruktuuri AIGC + -sosiaaliselle asettelulle. Mallin Prompt drive, ehdollisesti ohjattava sukupolvi, kontekstin ymmärtäminen, multimodaalinen ymmärrys ja muut ominaisuudet tekevät keskustelusta paikan päällä sujuvaa ja luonnollista, mutta siinä on myös emotionaalista lämpöä.

Tekstistä on tullut ensimmäinen askel Soulin tunteiden tunnistuskyvyn toteuttamisessa, ja se on vähitellen laajentunut yhdestä modaalisuudesta useampiin modaliteettiin. Tänä vuonna Soul lanseerasi suuren puheen generointimallin ja päivitti virallisesti itse kehitetyn suuren puhemallin, joka kattaa puheen generoinnin, puheentunnistuksen, puhedialogin, musiikin generoinnin ja muut alaosastot. Se tukee myös todellista sävelen generointia, puheen DIY:tä ja muita toimintoja jolla on monia tunteita sisältäviä, mukaansatempaavia reaaliaikaisia dialogeja.

Sen lisäksi, että Soul pyrkii jatkuvasti kehittämään emotionaalista tekoälyä mallitasolla, se on tietysti myös käyttänyt niitä alustansa erilaisissa sosiaalisissa skenaarioissa rikastaakseen ja parantaakseen käyttäjien interaktiivista tekoälykokemusta.

Otetaan esimerkkinä Soulin antropomorfinen dialogirobotti "AI Goudan". Se luottaa Soulin itse kehittämään suureen kielimalliin Soul. Lähetimme heille ennakoivasti hoitoa keskustelukohtauksen perusteella, aivan kuin he olisivat oikea henkilö. keskustelun toinen pää. Samalla käyttäjät voivat myös muokata omia munia ja kokea ainutlaatuista virtuaalista ihmisten vuorovaikutusta.

AI Goudan on myös osoittanut integrointikykynsä antropomorfismissa, tiedoissa, monimuotoisuudessa ja muissa näkökohdissa. Monet Soul-sivuston käyttäjät ihmettelivät sen voimakkaita antropomorfisia vuorovaikutuskykyjä tee aloite lähettääksesi viestin ja valittaa: "Pelkään, että Goudan ei ole todellinen henkilö."

Lisäksi Soul luottaa myös Souliin Ihmissusia koskevassa puheessa ei ole tottelemattomuuden tunnetta.

Toinen esimerkki on, että Soul julkaisi ensimmäisen itsenäisen uuden sovelluksensa pääsivuston ulkopuolella, "Echo of Another World". Tekoälyn sosiaalisena alustana käyttäjät voivat osallistua mukaansatempaavaan reaaliaikaiseen viestintään virtuaalisten ihmishahmojen kanssa useissa kohtauksissa ja tyyleissä. Tietenkin käyttäjät voivat mukauttaa virtuaalisia hahmoja ja henkilökohtaisia asetuksia (kuten taustakokemusta, persoonallisuutta jne.) mieltymystensä mukaan, mikä on erittäin pelattavaa.

Samoin itse kehitetty äänen suuri malli näyttelee roolia myös kohtauksissa, kuten AI Goudan, Werewolf Phantom ja Echoes of Another World. Esimerkiksi Echoes of Another World tukee äänipuhelutoimintoa. Virtuaaliset hahmot voivat kommunikoida käyttäjien kanssa luonnollisesti ja reaaliajassa, mikä rikastuttaa interaktiivista kokemusta.

"Echo toisesta maailmasta" reaaliaikainen äänipuhelutoiminto.

Sen lisäksi, että Soul jatkaa syventää tekoälyn antropomorfisia vuorovaikutuksia sosiaalisissa skenaarioissa, kuten älykkäässä vuoropuhelussa, peleissä ja äänessä, Soul kehittää myös kykyä luoda erilaisia maalaustyylejä oman estetiikkansa mukaisesti visuaalisen luomisen alalla luoden tekoälyn digitaalisia avatareja. ja eteneminen kohti moniulotteista kattavaa vuorovaikutusta.

Voidaan nähdä, että Soulin ulkoasu tekoälyn tunnetunnistuksen alalla on kattanut kielen, äänen ja visuaaliset multimodaalit, jotka työskentelevät yhdessä tekstissä, kuvissa, ääni- ja videokohtauksissa, jotka liittyvät läheisesti sosiaaliseen vuorovaikutukseen, jolloin käyttäjät voivat olla vuorovaikutuksessa kolmiulotteinen, moniaistiinen ihmisen ja tietokoneen vuorovaikutus. Koe lämmin tekoäly vuorovaikutuksen aikana.

Johtopäätös

Vuotta 2024 kutsuvat monet alan ihmiset AIGC-sovellusten ensimmäiseksi vuodeksi. Kaikkien huomio ei ole enää vain parametreissa ja perusominaisuuksissa. Mallikerroksesta sovelluskerrokseen siirtymisen trendin myötä voimme voittaa lisää käyttäjiä ja markkinoita vain olemalla ensimmäinen, joka ottaa tekoälyn käyttöön vertikaalisilla aloilla ja skenaarioissa. Erityisesti ihmisen ja tietokoneen välisessä vuorovaikutuksessa C-puolen radalla on luonnollisempaa keskittyä käyttäjien tarpeisiin. Tämä näkyy hyvin sosiaalialalla.

Aikaisemmin monet treffisovellukset, kuten AlienChat, lopetettiin, ja keskusteluaihe "Ensimmäinen tekoälyyn rakastuneita nuoria rakastui" nousi kuumaksi hakuaiheeksi. Tämän takana toiminnallinen homogeenisuus on osa syytä, mutta myös siksi, että kokemus ei muutu assistentin/NPC-roolista kumppaniksi, joka todella tarjoaa henkistä tukea. Tämä edellyttää ihmisen ja tietokoneen vuorovaikutusmenetelmien ja -skenaarioiden rikastamista sosiaalisella alalla, jotta tekoäly voi osallistua täysimääräisesti kaikkiin sosiaalisiin yhteyksiin, kommunikoida syvästi käyttäjien kanssa ja tarjota heille tunnearvoa.

Tämä voi olla myös yksi seuraavista keskeisistä kilpailupisteistä tekoälyn sosiaalisessa suunnassa. Ei ole vaikea ymmärtää, miksi Soul sovelluskerroksena painottaa niin paljon itse kehitettyjen teknisten kykyjen keräämistä. Viimeisenä aikana se on toisaalta sitoutunut luomaan yksilöllisiä, antropomorfisia ja monipuolisia tekoälyominaisuuksia, toisaalta se on nopeuttanut tekoälyn natiivisovellusten käyttöönottoa useista ulottuvuuksista, mukaan lukien sosiaalisen kokemuksen parantaminen, Tekoälyn sosiaalinen verkostoituminen, tekoälypelit jne. muodostavat Täydellinen AI-tuoteketju tarjoaa käyttäjille hauskaa tekoälyn vuorovaikutusta erilaisissa sosiaalisissa skenaarioissa.

Voidaan sanoa, että viime vuosina Soul on haukkunut sarjan tuotetuloksia, jotka perustuvat sen itse kehittämiin kielen ja puheen suuriin malleihin, ja on kerännyt runsaasti innovatiivisia teknologioita ja käytännön kokemusta tekoälyn ja henkisen vuorovaikutuskokemuksen parantamisesta. Käyttäjiä, jotka kaikki ovat edistäneet sen menestystä MER24:ssä. Ensimmäisen paikan voittaminen haasteessa tasoitti tien kilpailla korkealaatuisten osallistuvien joukkueiden kanssa ympäri maailmaa.

Viime vuosina tällaisia haasteita on ollut yhä enemmän, kuten NTIRE 2024 AIGC Quality Evaluation Challenge CVPR 2024 Workshopissa ja kaksi peräkkäistä MER Challenge -tapahtumaa vuosina 2023 ja 2024. Kotimaiset yritykset ovat toistuvasti saavuttaneet hyviä tuloksia teknologiaan luottaen. käytännössä kertynyt. Esimerkiksi SenseTime, joka sijoittui ensimmäiseksi MER23:ssa viime vuonna, ja Soul, joka sijoittui ensimmäiseksi tänä vuonna, ovat saavuttaneet merkittäviä tuloksia huomiossaan ja investoinnissaan AIGC-teknologiaan ja sovelluksiin.

On ennakoitavissa, että Soulin kaltaiset alustat, jotka vaativat teknologisia ja tuoteinnovaatioita, luovat jatkossakin lisäarvoa käyttäjille tekoälyominaisuuksien julkaisuprosessissa. Vain tällä tavalla he voivat saavuttaa kestävämpää ja kestävämpää sisältöä ja yhteisön ekologiaa. monipuolista liiketoiminnan arvoa.

uutiset

Älä keskity vain Herin ChatGPT-versioon. Kotimaiset pelaajat ovat myös kiinnostuneita monimuotoisesta AI-antropomorfisesta vuorovaikutuksesta.

Johdanto

yhteystietoni