uutiset

ensimmäinen kotimainen suurmalli "silmillä" paljastettiin palvelumessuilla

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

kotimainen suuri malli avasi "silmät" onnistuneesti, ja zhipu ai (beijing zhipu huazhang technology co., ltd.) esitteli viimeisimmän selkeän version vuoden 2024 kiinan kansainvälisillä palvelukaupan messuilla (kutsutaan nimellä fair for trade in services). ), joka avattiin 12. syyskuuta. yan app "video call" -toiminto. on todettu, että tämä on maailman ensimmäinen laajamittainen videopuhelutoiminto, joka on avoin yleisölle.
raporttien mukaan qingyanin videopuhelutoiminto kattaa kolme päätilaa: teksti, ääni ja video, ja siinä on reaaliaikaiset päättelyominaisuudet. käyttäjät voivat kytkeä kameran päälle ja kommunikoida qingyanin kanssa videopuheluikkunan kautta. qingyan ei voi vain "nähdä" käyttäjän näyttöä, vaan myös ymmärtää ohjeita ja suorittaa ne tarkasti ja vastata nopeasti, vaikka se keskeytyy usein. korostamalla näytön avainkohdat qingyan voi myös ymmärtää, mihin käyttäjä haluaa sen keskittyvän.
tarjoa apua kotitehtävissä.
zhipu ai totesi, että gpt-4o julkaisi aiemmin puheen, mutta ei avannut videotoimintoa yleisölle qingyanin avulla voit kokea uusinta ai-/suurmalliteknologiaa. aiemmin vuorovaikutus tekoälyn kanssa tapahtui pääasiassa tekstin muodossa videotoiminnon avulla käyttäjät voivat jättää hyvästit pitkille tekstikehotteille ja kommunikoida sujuvasti tekoälyn kanssa. qingyan on kuin ihmisavustaja, jolla on näkemys ja ymmärrys käyttäjän ympärillä niin kauan kuin kamera ottaa kuvan, tekoäly tietää käyttäjän ympäristön ja sen, mitä he haluavat tekoälyn tekevän ohjeet.
kotimainen suuri malli avaa "silmät" onnistuneesti.
qingyan-videopuhelutoiminto voidaan muuntaa myös kannettavaksi englannin kääntäjäksi, joka voi toteuttaa välittömän käännöksen kiinan ja englannin välillä, käydä englanninkielistä keskustelua käyttäjän ympäristötietojen perusteella ja auttaa korjaamaan käyttäjän ääntämis- ja kielioppivirheet. tämän toiminnon käyttöskenaarioihin kuuluu tarinoiden kertominen maisemapaikoista milloin tahansa matkustettaessa, näkövammaisten ympäristön tunnistaminen jne. se voi myös tarjota aiheen kotitehtävien tutorointia ja haastatteluopastusta, täydentää pöytäkirjoja ja yhteenvetoja kokouksissa, analysoida monimutkaista dataa kaavioita ja tulkita tietokoneita reaaliajassa.
näillä palvelumessuilla zhipu ai esittelee erilaisia ​​uusimpia tuotteita. qingyan appin videopuhelutoiminnon lisäksi se sisältää myös tekoälyn luoman videotoiminnon. zhipu julkaisi videon sukupolven mallin cogvideox aiemmin tänä vuonna ja käynnisti "qingying"-toiminnon videoiden luomiseksi zhipu qingyan -sovelluksessa. qingying on avoin kaikille käyttäjille. syötä vain tekstiä tai lataa kuva, niin 6 sekunnin video voidaan luoda 30 sekunnissa. tämän vuoden heinäkuussa qingying julkaisi qingyan-sovelluksen, ja käyttäjät loivat yli miljoona videota kuudessa päivässä.
paperin toimittaja zhang jing
(tämä artikkeli on the paperista. jos haluat lisätietoja, lataa "the paper" -sovellus)
raportti/palaute