uutiset

Google julkaisee Gemini Live: tukee AI-äänichattia ja voi simuloida haastattelukohtauksia

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT Housen uutisten mukaan 14. elokuuta Google piti tänään Pixel 9 -sarjan matkapuhelinten julkaisukonferenssin.Gemini Live -palvelu on julkaistu ja on englanninkielisten Gemini Advanced -tilaajien saatavilla tästä päivästä alkaen.


Edistä luonnollista, sujuvaa keskustelua

Google sanoi, että Gemini Live tarjoaa mobiilikeskustelukokemuksen, jonka avulla käyttäjät voivat keskustella vapaasti Geminin kanssa.

Gemini Liven voidaan sanoa olevan OpenAI ChatGPT:n käynnistämä uusin Advanced Voice -tila (rajoitettu Alpha-testi). Se ottaa käyttöön parannetun puhemoottorin ja voi käydä keskusteluja, jotka ovat johdonmukaisempia, emotionaalisesti ilmeikkäämpiä ja realistisempia.


Google sanoo, että käyttäjät voivat keskeyttää chatbotin sen puhuessa esittääkseen jatkokysymyksiä, ja chatbot mukautuu käyttäjän puhetapoihin reaaliajassa.

Osa IT Housen kääntämästä Google-blogiviestistä on seuraava:

Gemini Liven avulla [käyttäen Gemini-sovellusta] käyttäjät voivat puhua Geminille ja valita [10 uudesta] luonnollisesta äänestä, joihin se voi reagoida. Käyttäjät voivat jopa puhua omaan tahtiinsa tai keskeyttää vastauksen kysyäkseen selventäviä kysymyksiä, aivan kuten ihmisten keskustelussa.

Google esitteli Gemini Live -kohtauksen simuloiden käyttäjän ja rekrytointipäällikön (tai tekoälyn, tilanteen mukaan) välistä keskustelua ja tarjoten käyttäjille puhetaitoja koskevia suosituksia ja optimointiehdotuksia.

Googlen tiedottaja sanoi:

Live käyttää Gemini Advanced -malliamme, jota olemme mukauttaneet lisäämään keskustelua. Mallin suurta kontekstiikkunaa käytetään, kun käyttäjät käyvät pitkiä keskusteluja Liven kanssa.
Ei tue multimodaalista syöttöä

Gemini Livessä ei vielä ole yhtä niistä ominaisuuksista, joita Google esitteli I/O:ssa: multimodaalista tuloa.

Google julkaisi toukokuussa valmiiksi nauhoitetun videon, jossa Gemini Live näkee käyttäjän ympäristön ja reagoi siihen puhelimen kameralla otettujen valokuvien ja videoiden kautta, kuten nimeämällä rikkoutuneen polkupyörän osia tai Selitä mitä osa koodista tietokoneen näytöllä ei.

Google sanoi, että multimodaalinen syöttö julkaistaan ​​"myöhemmin tänä vuonna", mutta kieltäytyi jakamasta yksityiskohtia.