2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Jin Lei tulee Aofein temppelistä
Qubits |. Julkinen tili QbitAI
Kierto, iso kiertyminen.
Juuri varhain tänä aamuna Google-versio Her-Gemini LiveVirallisesti julkaistu.
Loppujen lopuksi se on ilmeisesti vertailukohta OpenAI:n GPT-4o:lle, jonka voidaan sanoa herättäneen teknologiapiirin huomion.
Virallisilla verkkosivuilla julkaistussa demossaValokuva Q&AToiminnon vaikutus on seuraava:
Sen toteuttama yleinen toiminto on ottaa matkapuhelimella kuvia konserttijulisteista ja antaa Geminin tarkistaa käyttäjän kalenterista, sopiiko aikataulu osallistumiseen.
Ja voit myös suorittaa tämän perusteella useita myöhempiä toimintoja, mukaan lukien hintojen tarkistaminen kiinteänä ajankohtana jne.
Kuitenkin... kun puhuttiin lehdistötilaisuuden paikan päällä järjestettävästä esittelytilaisuudesta, maalauksen tyyli muuttui täysin.
Katso videonauhuri:
Videon osoite: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Hmm... Pikkuveljen ilme on hieman paniikissa paljaalla silmällä.
Jopa tunnettu teknologiamedia TechCrunch on sisällyttänyt tällaisen emojin:
Jotkut nettilaiset ottivat jopa kuuman kommenttitilan käyttöön:
Pystyn hakemaan kalenteristani 10 sekunnissa.
Tietenkin tämä on vain pieni jakso Made by Googlesta tänään.
Jos haluat lisätietoja Gemini Livesta, jatka lukemista alla.
Kuten juuri mainitsimme, Gemini Liven ja GPT-4o:n toiminnot ovat hyvin samankaltaisia.
"Valokuvakysymysten ja -vastausten" lisäksi se voi myös käydä reaaliaikaisia keskusteluja ja jopa keskeyttää Kaksoset vastausprosessin aikana.
Gemini Liven toiminnot ovat tällä hetkellä avoinna Advanced-tilaajille Android-järjestelmässä (vain englanniksi).
Tulevien viikkojen aikana tämä ominaisuus laajennetaan useammille kielille ja se tulee saataville iOS:lle.
olemassadialogin ääniToisaalta Gemini Live on käynnistynyt10 lajiaUusia ääniä on valittavissa, ja tehoste on seuraava:
Videon osoite: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
olemassatoimiaToisaalta, koska Gemini on täysin integroitu järjestelmään, se voidaan kutsua yksinkertaisesti painamalla virtapainiketta pitkään tai sanomalla "Hei Google".
Esimerkiksi, kun kirjoitat sähköpostia, anna Geminin auttaa sinua luomaan vastaava kuva.
Ulkomaiset tiedotusvälineet ovat kuitenkin saaneet tästä ominaisuudesta ristiriitaisia arvioita.
Esimerkiksi The Vergen kirjailija kirjoitti sisäänHenkilökohtainen testiMyöhemmin annettu otsikko on--
Gemini Live on nopeampi kuin Google, mutta hankalampi.
Erityinen syy oli, että kirjoittajan auton audiojärjestelmä epäonnistui yhtäkkiä kolmen päivän matkan aikana.
Ratkaisun löytäminen alkuperäisen Google Assistantin avulla kesti vähintään viisi minuuttia, mutta Gemini Live vei vain 15 sekuntia.
Kuitenkin Gemini Liven jatkuva puhe keskustelun aikana ja vuorovaikutusmenetelmä, joka vaatii käyttäjiä aktiivisesti keskeyttämään, sai kirjoittajan nolostumaan.
Hän uskoo:
Ääni ja puhetapa ovat niin inhimillisiä, että minusta tuntuu epämukavalta keskeyttää se.
Vuorovaikutuksessa Gemini Liven kanssa on enemmän tunteita kuin sen käyttäminen ongelmanratkaisutyökaluna.
Sattumalta Gemini Live in:lleJuokse pilvessäWall Street Journal antoi myös terävän arvion tästä asiasta --
Dialogin edistyminen, toiminnallisuuden regressio.
Teknisellä tasolla GPT-4o on päästä päähän -järjestelmä, mutta Googlen julkaiseman sisällön perusteella Gemini Live ei pidä paikkaansa.
Sen sijaan STT-, VAD-, LLM- ja TTS-järjestelmät on integroitu:
Lisäksi Gemini Live näkyy myös Googlen julkaisemassa uudessa Pixel-matkapuhelinsarjassa.
Sisältää Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro ja Pixel 9 Pro XL.
Tekoälytoimintojen osalta Googlen Pixel-puhelimet ovat lisänneet ominaisuuden nimeltä"Lisää minut"toiminto.
Lisätyn todellisuuden (AR) ja tekoälyteknologian avulla voidaan "täyttää" hahmot kahdessa eri valokuvassa yhteen.
Vaikka Googlen tällä kertaa julkaisema Gemini Live on vastaus OpenAI GPT-4o:lle, suurten mallien aikakauden alkamisen jälkeen voimme nähdä hyvin ilmeisen trendin—-
Google ei pysy OpenAI:n mukana.
Ensin OpenAI:sta tuli pioneeri ChatGPT:n julkaisun kriittisimmässä vaiheessa, mutta myöhemmin Google julkaisi Bardin, joka oli tällä kertaa hyvin samanlainen kuin Gemini Live, ja sittemmin kumottiin.
Viimeisen puolentoista vuoden aikana näyttää siltä, että OpenAI on johtanut kaikkien tärkeimpien mallien ja sovellusten julkaisua.
Toisaalta Googlella ei ole vain hidasta vauhtia jopa yleisen mielipiteen kannalta, vaan OpenAI on jättänyt Googlen suurimman vuosittaisen tapahtuman (I/O-konferenssin) varjoonsa henkilöstömuutoksesta (Iljan erosta).
Joten miksi Google epäonnistuu suurten mallien aikakaudella?
Tässä suhteessaGooglen entinen toimitusjohtajaEric Schmidt (joka palveli vuosina 2001–2011) ilmaisi näkemyksensä viimeisimmässä puheessaan Stanfordissa:
Google pitää erittäin tärkeänä työn ja yksityiselämän tasapainottamista, kuten työntekijöiden mahdollisuutta työskennellä kotoa käsin.
Mutta startup-yrityksissä he työskentelevät todella kovasti.
Videon osoite: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Jotkut nettimiehet jopa kertoivat uutisesta:
Veljeni on Googlen huipputekoälyohjelmoija. Hän työskentelee kolmessa kokopäivätyössä ja viettää Googlessa vain 2 tuntia päivässä.
Joten mitä mieltä olet tästä, jätä viesti kommenttikenttään keskustellaksesi.
Viitelinkit:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones