uutiset

Doubao PC-versio "unboxed", äänenvoimakkuudesta murteeseen

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Volcano Engine AI Innovation Tour avattiin 22. elokuuta Shanghaissa. Tapahtuma esitteli papupussimallin parantamista kokonaisvaltaisessa pisteytyksen, puheentunnistuksen ja muiden näkökohtien osalta.Ääniominaisuudet ovat tämän julkaisun painopiste.

Suuri mallitiimi keskittyy keskustelulliseen tekoälyyn, reaaliaikaiseen vuorovaikutukseen ja tulostukseen Seed-ASR, tämä saavutus voi olla verrattavissa OpenAI:n 31. heinäkuuta julkaisemaan ChatGPT:n uuteen edistyneeseen äänitilaan.

OpenAI:n työntekijät pystyivät keskeyttämään chatbotin ja pyytämään sitä kertomaan tarinan eri tavalla, ja chatbot otti keskeytykset rennosti ja korjasi vastauksiaan sosiaaliseen mediaan tuolloin julkaistujen videoiden mukaan.

Yksinkertaisesti sanottuna se tukee "ajattelua ja puhumista samaan aikaan".Sinulla on vahvempi kontekstitietoisuus, joten sinulla on parempi päättelykyky ja tarkemmat vastaustulokset.

Silmiinpistävää on sepapupussiVäitteet sen puhekyvyistäTukee mallin tunnistustamandariiniKantonin, Shanghain, Sichuanin, Xi'an, Hokkien ja muut kiinalaiset murteet.

Tämä saa minut innokkaaksi keskustelemaan sen kanssa Hongkongissa ja Sichuanissa.

Seuraavaksi perustan sen 1.19.5_mac-versioonDoubao AI PC-versio,testataAI-tekstin lukeminen ja kuvakaappauksen tunnistusSekä viime aikoina suosittuAI-videon katselu, AI-murteen tunnistusja muut toiminnot,Katso, miten papupusseja verrataanErilaisia ​​verkkoversioita AI suuria mallejaMitä uutta tarjotaan.

Vanhan säännön mukaisesti ahdistuneet ystävät voivat vierittää alas suoraan yhteenveto-osioon.

Tekoälyn tekstinlukukumppani

Ensimmäinen on tekoälytekstin kumppaniluku.

Avasin uutisen, rullasin alas yhteenveto-osioon, valitsin kappaleen, jota halusin auttaa, ja säkkipussi ilmestyi automaattisesti.Etsi, käännä, tulka, kopioija muita toimintoja.

olemassaLöydä lisää taitojaNiiden joukossa on tekoälyn sanan rajaustyökalupalkki, jossa on 6 toimintoa, kuten tekstin lyhennys, korjaus ja kiillotus, 3 toimintoa, kuten sosiaalisen median tekstinkirjoitus tai videoskriptit, ja 4 toimintoa, kuten viikoittaisten raporttien luominen, OKR ja koodi. virheen korjaus, mukaan lukien yhteenveto eduista ja haitoista, tehtäväkohteiden poimiminen, aivoriihi jne. sekä vaikeasti luokiteltavia asioita.Moduulitoimintoja on yhteensä 22 muokattavissa olevilla yläasetuksilla.

Valitsin yksinkertaisimman pyynnön Doubaon selitykseksi Odotettuani noin 25 sekuntia, sain seuraavan sisällön.

Voidaan nähdä, että Doubao tiivistää ensin yleisen idean, jota seuraa keskustelullisempi suosittu selitys.Silmiinpistävää on, että se tunnistaa ja selittää aktiivisesti valitun tekstikappaleen, kuten yllä olevan "Pareto-säännön", erisnimet.

Tässä vaiheessa jää nähtäväksi, voivatko Doubao-moduulin tarjoamat 22 toimintoa osoittaa syvempää ymmärrystä älykkyyden ja personoinnin suhteen.Mutta on selvää, että kun tietokone on käynnissä taustalla, minun ei tarvitse kopioida ja liittää sitä toiseen ikkunaan etsiäkseni tai edes poimia erisnimisiä hakua varten tai kysyä kysymyksiä erikseen.

AI-kuvantunnistus

Kun otin kuvakaappauksen Beanbaolla, se ponnahti esiinKysymys ja vastaus, käännös, QQ papupussiToimintokohteita on 3, joten valitsin lukion matematiikkatehtävän ja pyysin Doubaota ratkaisemaan sen ja vastaamaan kysymyksiin.

Doubao ei ainoastaan ​​tarjoa ratkaisuprosessia ja vastausta kysymykseen kuvakaappausalueella, vaan tarjoaa myös useita samanlaisia ​​kysymyksiä ja niiden ratkaisuja.

Mutta kun käytän Translate- ja Ask Doubaota, en vain osaa segmentoida lauseita älykkäästi, vaan teen myös usein virheitä.

Kuvantunnistuksen vaikeuden vuoksi vaihdoin kappaletekstiin, mutta parannusta ei tapahtunut.

Yritin uudelleenKysy papupusseista, alisteinenJärjestä kuvan ydinsisältöjaPura tekstiäKokeilin kahta moduulia erikseen.

Kaiken kaikkiaan sisällön organisoinnin ydintoiminnon suorituskyky on erinomainen.Mutta tekstinpoisto ei edes tunnistanut koko kuvaa, ja tämä oli silti siististi järjestetty kirjasintyyppi.

AI katsomassa videoita

Videoiden katselu tekoälyllä on tällä hetkellä rajoitettu sivuston b videoihin ja vaatiiAvaa Doubao-käyttöliittymässäJa kirjaudu sisään B-aseman tilille.

Joten valitsin satunnaisesti "The Genre of Late Drinking" -sarjan kolmannen kauden ja jakson 7 sisällön, ja noin 20 sekunnin odotuksen jälkeen sain seuraavan sisällön.

Voidaan nähdä, että videosegmenttien aikajanalla tekoälyn kuvan ja tekstin vastaavuus ei ole tarkka, muttaPeriaatteessa sisällön segmentointi voidaan saavuttaa.

Video on dubattu japaniksi perinteisellä kiinalaisella tekstityksellä, mikä on luultavasti hieman noloa.

Videon alussa on selkeä tiivistelmä pääajatuksesta, mutta se ei heijastu selkeästi oikealla olevaan tekstiyhteenvetoon. Lisäksi "Kiitollisuus muille" -osiossa videon hahmo kiitti rouva Ozoa herra Ushidan sijasta, mikä on virhe beanbag-yhteenvedossa.

AI murteen tunnistus

Virallisen ilmoituksen mukaan Doubao tukee kantonia, shanghailaista, sichuania, xi'ania ja hokkienia. Seuraavaksi katsotaan, tunnistaako Doubao rikki kantonin kielen (ei ole alkuperäistä murretta, vain puolen vuoden tuoma rikki kantonin kielellä). asuu Hongkongissa, odotan innolla enemmän alkuperäiskansojen kokemuksia~).

Kielentunnistuksessa ei ole ongelmaa. Doubao ymmärtää "Haluan syödä puuropohjaista kuumaa pottia" ja tarjoaa jopa hakuvaihtoehdon "Mistä löydän herkullisia puuropohjaisia ​​hot pottia Pekingissä?", mutta viestin lähettämisen jälkeen se hyppäsi tekoälyhaun keskusteluliittymään, ja vastaus minulle oli tekstiä äänen sijaan.

Lisäksi murresyöttö on käytettävissä vain etusivulla, enkä voi jatkaa murretta syöttämistä keskusteluliittymässä. Siksi minun on palattava kotisivulle uudestaan ​​​​ja uudestaan, ja aina kun viesti lähetetään, avautuu uusi navigointisivuikkuna. . .

Murteiden syöttäminen on kuitenkin edelleen suuri läpimurto, ja yleinen suorituskyky on epätyydyttävä. On selvää, että Doubao-sovellus tukee äänivastauksia.

Kokeilin käyttää mobiilisovellustamurteen ääntäminenSama lause syötettiin, Doubao päättyiMandariini ääniVastasi minulle ja antoi valitun hakusanan "Mistä löydän herkullisen puuron hot pot Pekingissä?"

Toisin sanoen Doubao tukee murresyöttöä, mutta ei tällä hetkellä tue murteen vuorovaikutusta.Tätä toimintoa käytetään enimmäkseen hauskoissa ja liiketilanteissa, kuten kokouspöytäkirjojen järjestämisessä eri kielillä osallistuville osallistujille.

Yhteenveto istunto

Mielikuvituksessani työpöydällä on tekoälyn elektroninen nukke, joka antaa minulle kissani tavoin emotionaalista arvoa ja auttaa todella käsittelemään kaikkea minua kohtaan. Se on yhtä helppo herätä kuin Siri, mutta tehokkaampi kuin Siri.

Doubaon tekoälyn tekstinlukua voidaan käyttää kaikissa PC-puolen sovelluksissa, ja se tarjoaa 22 moduulitoimintoa. Perustekstin kiillotuksen lisäksi sillä on myös skenaariopohjainen käyttöalue sosiaalisille eläimille, ohjelmoijille ja itsemediatyöntekijöille kuvitellut perustoiminnot, mutta siellä on myös paljon tilaa tutkimiselle ja kasvulle.

Kuvantunnistuksen kannalta se on hyvä ratkaisemaan ongelmia ja vastaamaan kysymyksiin, mikä vastaa PC-puolen läksyjengiä ja apinoita. PC:n käyttäjäkunta huomioon ottaen Doubaon odotetaan kuitenkin tekevän syvällisiä ponnisteluja edistyneen matematiikan+ alalla. Vastaukset yleisiin kotitehtäviin ja koepapereihin ovatkin nopeampia matkapuhelimissa. Vain sähköisillä kysymyksillä tai papereilla on kysyntää tietokoneille.

Tekoälyvideoiden segmentointi- ja yhteenvetotoiminnot ovat erittäin silmiinpistäviä, etenkin populaaritieteellisten videoiden kohdalla. Humanististen ja yhteiskuntatieteiden teema on yhteinen ongelma kaikille suurille malleille.

Itse asiassa tekoälymurre on ominaisuus, jota odotan eniten,Loppujen lopuksi "paikallinen ääntäminen pysyy ennallaan ja hiukset temppeleistä haalistuvat Joskus kotikaupunkini on pitkä lista ruokalistoista, ja joskus se on tuttu "se maku". Mutta kaiken kaikkiaan Doubaon murteen interaktiivisella ekologialla on vielä matkaa.

Murredialogi identifioi paitsi nykyajan kaupunkilaisten kotikaupunkitunnelmia. Vielä tärkeämpää on, että teknologia tunkeutuu kylmään ruutuun ja välittää niistä, jotka eivät osaa puhua yleistä "kiinaa" - he kirjoittavat elämällään hiljaista historiaa, mutta he tarvitsevat myös tekoälyn mukana tulevia asioita .

Kun murteet siirtyvät tunnistamisesta vuorovaikutukseen, Doubao voi myös mennä pidemmälle.