2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Uusi viisausraportti
Toimittaja: Toimitusosasto
[Johdatus uuteen viisauteen]Google-versio hänen debyyttistään ennen OpenAI:ta? Googlen äänimalli Gemini Live tulee pian saataville 3 miljardiin Android- ja 2,2 miljardiin iOS-laitteeseen maailmanlaajuisesti. Vaikka live-esittely oli vielä hieman kaatunut, Google oli päättänyt olla odottamatta kauempaa ja päättänyt voittaa OpenAI:n ja taistella Applea vastaan!
OpenAI, estettiinkö se juuri?
Google ilmoitti myös virallisesti OpenAI:n "Herin" kannoilla: julkaisevansa AI-äänitoiminnon!
Juuri äsken "Made by Google" -puheenvuorossa Google ilmoitti Gemini Liven, äänitilan, käynnistämisestä. Gemini Live on pian saatavilla Gemini-mobiilisovelluksessa.
Kilpavarustelu Googlen ja OpenAI:n välillä on alkanut jälleen.
Katsokaa OpenAI:ta. Kolme kuukautta sitten uraauurtava "Her" on edelleen hiljainen. Tämä on Googlen sensuroima rytmi.
Googlen läsnä oleva johtaja Rick Osterloh sanoi myös merkityksellisesti: "Olemme kuulleet liian monia lupauksia tekoälystä ja iskulauseita sen tulevasta julkaisusta. Tänään haluamme näyttää todellista edistystä!"
Lisäksi Google esitteli tämän esityksen aikana yksityiskohtaisesti, kuinka Gemini integroidaan syvemmin Androidiin, sovelluksiin ja uusiin Pixel-laitteisiin.
Yhdellä kerralla julkaistussa Pixel 9 -matkapuhelinsarjassa Google tutki myös uutta "AI+-matkapuhelinten" muotoa: millaisen laitepuolen tekoälytuotteen muodostaa Geminin, Androidin ja Pixelin integrointi.
Voiko Google nyt voittaa Applen tekoälypohjaisella Androidilla?
Googlen "Her" on myös täällä
Googlen mukaan Gemini Live on uusi mobiilikeskustelukokemus.
Jos haluamme pohtia, millaisia työpaikkoja taitojen ja koulutuksen perusteella voisimme löytää, Kaksoset voivat heti jutella kanssamme reaaliajassa.
Tämä tunne on kuin taskussasi olisi huolehtiva avustaja, joka voi keskustella milloin tahansa.
Ja kuten OpenAI, myös Googlen äänitoiminto mahdollistaa sen, että käyttäjät voivat kommunikoida sen kanssa luonnollisella keskustelukielellä, ja sen vastauksissa käytetään myös ihmisen kaltaista ääntä ja rytmiä.
Kuuntele alla olevaa ääntä. Useilla mies- ja naisäänillä on hyvin luonnolliset sointiäänet.
Antaakseen meille mahdollisimman luonnollisen kokemuksen Google on käynnistänyt 10 ääntä yhdellä hengityksellä, ja voimme valita suosikkisävelemme ja -tyylimme haluamallasi tavalla.
Lisäksi Gemini Live tukee myös handsfree-toimintoa. Vaikka Gemini-sovellus olisi taustalla tai puhelin on lukittu, voimme silti puhua sille aivan kuten tavallisessa puhelussa.
Voimme myös keskeyttää sen ja vaihtaa aihetta milloin tahansa - näyttää tutulta, eikö? Aivan oikein, se voi tehdä kaiken, mitä OpenAI:n ääni voi tehdä.
OpenAI:n edistynyt äänitoiminto "Her", joka hämmästytti kaikkia toukokuussa, on edelleen valmisteilla. Viime kuun lopussa se avattiin valikoivasti vain pienelle määrälle Alpha-testin osallistujia.
Nopeudessa Google voittaa selvästi OpenAI:n.
Gemini Live on nyt saatavilla Android-laitteille hintaan 19,99 dollaria kuukaudessa Google Gemini -sovelluksen kautta.
Englanninkielinen versio on tällä hetkellä avoinna, ja iOS-versio ja tuki useille kielille julkaistaan lähiviikkoina.
Toisaalta Googlen edistynyt äänitila tavoittaa myös laajemman joukon potentiaalisia käyttäjiä käyttäjien mittakaavassa kuin OpenAI.
Tiedäthän, että maailmassa on nyt yli 3 miljardia Android-käyttäjää ja 2,2 miljardia iOS-käyttäjää.
Osa syy siihen, miksi OpenAI:n äänitoiminto epäonnistui, voi liittyä tekoälyn epänormaaliin suorituskykyyn punaisen tiimin testissä.
Onko Google ratkaissut nämä tietoturvaongelmat kokonaan? Kukaan ei vielä tiedä, mutta on selvää, että Google, joka ei halua periksi toisille, päätti tällä kertaa tehdä kaiken.
Mutta se kääntyi kahdesti
Ainoa haittapuoli on, että Gemini Liven live-esittelyn aikana ilmeni hikkauksia.
Kun Googlen johtaja Dave Citron esitteli Geminin uusia ominaisuuksia Google-kalenterin, Tasksin ja Keepin yhdistämiseen uusissa Android-puhelimissa, hän ei odottanut kaatuvan kahdesti peräkkäin.
Hän otti ensin matkapuhelimellaan mainosjulisteen Sabrina Carpenterin muotinäytökseen San Franciscossa ja kysyi sitten Geminiltä: "Tarkista aikatauluni nähdäksesi, voinko osallistua Sabrina Carpenterin muotinäytökseen."
Geminin ensimmäisessä vastauksessa hän sanoi, että jotain meni pieleen ja hänen oli yritettävä uudelleen.
Kun kokeilin vaiheita juuri nyt toisen kerran, Kaksoset eivät vieläkään vastanneet.
Vasta kolmannella kerralla (toinen laite vaihdettiin) tulokset saatiin vihdoin ja yleisöstä kuului hurraus.
AI Assistantin uudelleenmäärittely
Tässä puheessaan Google sanoi: Geminin kanssa he ovat hahmottaneet uudelleen, mitä henkilökohtaisen avustajan merkitys ihmisille todella hyödyllisemmäksi – luonnollisemmaksi, keskustelevammaksi ja intuitiivisemmaksi.
Yhdistä lisää sovelluksia
Mitkä ovat hyvän AI-avustajan tärkeimmät avainsanat?
yhdistä.
Gemini on tällainen, se integroituu kaikkiin Googlen sovelluksiin ja työkaluihin, joita käytämme suurten ja pienten tehtävien suorittamiseen.
Ja toisin kuin muut avustajat, meidän ei tarvitse käyttää aikaa sovellusten ja palvelujen välillä vaihtamiseen.
Lähiviikkoina Google julkaisee myös uusia laajennuksia, kuten Keep, Tasks, Utilities ja YouTube Music.
Mikä ruoka on kuvassa? Kysy Kaksoset, niin se listaa kaiken puolestasi.
Oletetaan, että nyt haluamme pitää illallisjuhlat, kaksoset voivat käyttää erilaisia taistelulajejaan...
Gmailista se voi löytää jonkun meille lähettämän lasagne-reseptin, sitten lisätä ainekset Keepin ostoslistaan ja pyytää Geminiä laatimaan meille soittolistan ja pyytää sitä "muistuttamaan minua 90-luvun lopusta".
Googlen tulevassa kalenterilaajennuksessa voimme ottaa kuvan suoraan konserttijulisteesta ja kysyä Kaksosilta: Olenko vapaa sinä päivänä? Jos vastaus on kyllä, voimme myös pyytää Geminiä auttamaan meitä asettamaan muistutuksia ja valmistautumaan lippujen hankkimiseen.
Pyydä Kaksosia kirjoittamaan professorille sähköposti, jossa hän pyytää lomaa, ja pyydä määräajan pidennystä muutamalla päivällä vain puhumalla.
Kutsu Gemini yhdellä napsautuksella
Nyt Gemini on integroitu täysin Android-käyttökokemukseen.
Vain Androidissa voimme kokea tällaisen silkkisen pehmeän kontekstitietoisuuden.
Niin kauan kuin meillä on Android-puhelin, riippumatta siitä, mitä haluamme tehdä, Kaksoset voivat esiintyä tarvittaessa.
Pidä virtapainiketta painettuna tai sano "Hei Google" kutsuaksesi Gemini!
Jos käytät YouTubea, voit kysyä Geminiltä kysymyksiä videoista.
Oletetaan esimerkiksi, että teemme oppaan ulkomaille matkustamiseen ja olemme juuri katsoneet matkavideoblogin. Napsauta "Kysy tästä videosta" ja anna sen listata kaikki videossa näkyvät ravintolat ja lisätä ne Google Mapsiin tekee sen yksitellen.
Kun katsot alla olevaa kuvaa, Geminin luomat kuvat voidaan suoraan vetää ja pudottaa Gmailiin ja Google Messagesiin.
Uskon, että olet ymmärtänyt tämän operaation kauneuden...
Koska Gemini on rakentanut syvän integraation Androidille, tekoäly voi tehdä muutakin kuin vain lukea näytön sisältöä ja olla vuorovaikutuksessa monien jo käyttämiemme sovellusten kanssa.
Gemini 1.5 Flash, varustettu AI-avustimella
On kuitenkin kaksi ongelmaa: LLM, joka osaa paremmin tulkita luonnollista kieltä ja käsitellä tehtäviä, tarkoittaa usein sitä, että jopa yksinkertaisten tehtävien suorittamiseen kuluu enemmän aikaa.
Ja jos tekoäly osoittaa odottamatonta käyttäytymistä tai antaa epätarkkoja tietoja, se on myös päänsärky.
Tätä varten Google on erityisesti esitellyt uuden mallin - Gemini 1.5 Flash.
Se vastaa nopeammin ja sen vastausten laatu on korkeampi.
Tulevina kuukausina Google integroi mallin myös syvemmin Google Home-, Phone- ja Messages -palveluun.
Google sanoo, että olemme tänään virallisesti saavuttaneet käännepisteen, jossa tekoälyassistenttien hyödyllisyys on paljon suurempi kuin heidän haasteensa.
Luo kuvia kahdessa sekunnissa Imagen 3:n perusteella
Google julkaisi kokouksessa myös uuden AI-valokuvien luomissovelluksen - Pixel Studion.
Kauniin kuvan luomiseen tarvitaan vain muutama nopea sana.
Tärkeintä on, että se on Imagen 3:lle rakennettu paikallinen kuvageneraattorisovellus, joka voi luoda erilaisia kuvia 2 sekunnissa.
Tänään julkaistiin myös Imagen 3:n tekninen raportti. Tekniset tiedot löytyvät 32-sivuisesta paperista.
Paperiosoite: https://arxiv.org/pdf/2408.07009
Ensimmäinen tekoälypuhelin maksaa 20 krypton dollaria kuukaudessa
Google on sisällyttänyt kaikki nämä tekoälyominaisuudet uusimpaan matkapuhelinlaitteistoon.
Tapahtumassa Google julkaisi yhteensä neljä tekoälypuhelinta - Pixel 9, Pixel9 Pro, Pixel9 Pro XL ja toisen sukupolven taitettavan näytön Pixel 9 Pro Fold.
Mitä sinun ei pidä missata uudessa Pixel 9 -sarjassa, ovat AI-käyttöiset kameraominaisuudet.
Google kertoi, että kuvankäsittelyalgoritmi - HDR+pipeline - on täysin uusittu, jolloin otettujen kuvien kontrasti, varjot, valotus, terävyys, värit jne.
Seuraavat ovat Pixel 9 -sarjan puhelimien uudet tekoälyn kuvankäsittelyominaisuudet:
Lisää minut
Kohtaatko usein, että perhejuhlissa, tiimin rakentamisessa ja perhematkoilla otat vastuun valokuvaamisesta, mutta olet ainoa, joka puuttuu kuvista?
Sinun ei kuitenkaan tarvitse huolehtia siitä tulevaisuudessa.
Googlen "Lisää minut" -toiminto voi korvata pahoittelusi.
Ensin pitää ottaa ryhmäkuva. Sitten kuvan ottamisesta vastaava henkilö on vuorovaikutuksessa valokuvassa olevan henkilön kanssa ja ottaa valokuvan mukaan lukien "valokuvaaja".
Tällä hetkellä Pixel käyttää reaaliaikaista AR-tekniikkaa ohjatakseen toista henkilöä sommittamaan valokuvan siten, että se vastaa ensimmäisen valokuvan sommittelua.
Lopuksi Pixel yhdistää kaksi kuvaa varmistaakseen, että kaikki näkyvät samassa valokuvassa, mukaan lukien "valokuvaaja".
Kuvittele uudelleen
Toinen Reimagine-toiminto on helppo ymmärtää.
Tällä hetkellä Magic Editorin toiminnon avulla voit kuvata haluamasi tehosteen suoraan tekstikenttään.
Tekoäly voi muuttaa ideasi todeksi.
Voit esimerkiksi muokata valokuvan taustaa, tulivuoria, auringonlaskuja, revontulia ja muita kohtauksia ja leikkiä niillä haluamallasi tavalla.
Automaattinen kehys
Automaattinen sommittelu on Magic Editorin uusi ominaisuus, joka voi sommitella uudelleen jo otettuja kuvia.
Se voi jopa suurentaa valokuviasi ja luoda tyhjän alueen taustat tekoälyn avulla.
Zoomauksen tehostaminen
Zoom Enhance voi automaattisesti täyttää pikselien väliset raot ja ennustaa tarkasti yksityiskohdat korkealaatuisten suurennustehosteiden saavuttamiseksi.
Tekoälyominaisuuksien toteuttaminen on erottamaton Pixel 9 -sarjan takana olevista tehokkaista siruista.
Tehokkain tekoälyprosessori: Google Tensor G4
Uusi matkapuhelin käyttää Googlen äskettäin suunniteltua prosessoria - Google Tensor G4.
Google sanoi: "Tensor G4 -siru on tähän mennessä nopein ja tehokkain sirumme."
Viime vuoden Tensor G3:een perustuen Google loi yhteistyössä Samsungin kanssa puoliksi räätälöidyn Tensor G4 -prosessorin, joka perustuu 4nm:n prosessiin, käyttäen Armin toimittamia prosessori- ja GPU-ytimiä.
Samalla se käyttää Googlen omia moduuleja tekoäly-, valokuvaus- ja suojaustoimintojen tehostamiseen.
On raportoitu, että verrattuna kahteen edelliseen sukupolveen G4 on lisännyt verkkoselausnopeutta 20 %, APP:n käynnistysnopeutta 17 % ja päivittäisen sovelluksen akun virrankulutus kasvoi jopa 20 %.
Suorittimen osalta G4 on varustettu 1 Cortex-X4 ytimellä, joka toimii 3,1 GHz:llä, 3 Cortex-A720 ytimellä, jotka toimivat 2,6 GHz:llä, ja 4 Cortex-A520 ytimellä, jotka toimivat 1,95 GHz:llä.
Vertailun vuoksi Tensor G3:ssa on yksi Cortex-X3-ydin 2,91 GHz:llä, neljä Cortex-A715-ydintä 2,37 GHz:llä ja neljä Cortex-A510-ydintä 1,70 GHz:llä.
Vaikka Tensor G4:ssä on yksi ydin vähemmän, kaikki ytimet ovat 200–300 MHz korkeampia.
Vuotaneiden Geekbench-pisteiden mukaan Tensor G4 sai 2 005 pistettä yhden ytimen testissä ja 4 835 pistettä moniytimisessä. Vertailun vuoksi Tensor G3 sai yhden ytimen testissä 1 751 pistettä ja 4 208 pistettä moniytimisessä. Suorituskykyero on 14 %.
GPU:n osalta Tensor G4 käyttää samaa ARM Mali-G715 GPU:ta kuin viime vuoden Tensor G3, mutta taajuutta on nostettu 890 MHz:stä 940 MHz:iin. Tämä tarkoittaa, että Tensor G4:n GPU-suorituskyvyn pitäisi olla hieman parempi kuin Tensor G3:n.
Tukee uusia tekoälytoimintoja
Tekoäly on tietysti yksi Tensor-projektin tärkeimmistä liikkeellepanevista voimista.
Uudelleen suunniteltu Tensor G4 on suunniteltu tarjoamaan uusimmat Gemini- ja laskennalliset valokuvaustoiminnot.
Paikallisesti ajettavat Gemini Nano -mallit (suurimmassa versiossa on 3,5 miljardia parametria) voivat tuottaa sisältöä nopeudella 45 token/s.
Vaikka Googlen TPU on jo nopea, se ei ole kilpailijoitaan edellä token-käsittelyssä.
Vertailun vuoksi Qualcomm Snapdragon 8 Gen 3 voi tuottaa 15 merkkiä sekunnissa, kun MediaTek Dimensity 9300 voi suorittaa 7 miljardia parametria nopeudella 20 merkkiä sekunnissa.
Pixel 9 -sarjan ainutlaatuiset AI-ominaisuudet eivät kuitenkaan välttämättä ole täysin riippuvaisia uudesta sirusta, vaan pikemminkin muista tekijöistä.
Tekoäly vaatii myös suuria määriä muistia ja vaatii pääsyn nopeisiin ja suuriin muistivarastoihin monimutkaisempien mallien suorittamiseksi.
Pixel 9:ssä on 12 Gt RAM-muistia, ja Pro-sarja päivitetään 16 Gt: iin.
Google sanoi, että sulavamman tekoälykokemuksen saavuttamiseksi tämä on ensimmäinen kerta, kun se on varannut "omistetun osan RAM-muistista Geminin käyttämiseen laitteessa" estääkseen muita sovelluksia käyttämästä muistia.
Google ei kuitenkaan paljastanut, kuinka paljon siitä oli varattu tekoälytehtäviin.
Vaikka itse sirulla ei ole isoa tekoälyn päivitystä, se saattaa silti tuoda paremman tekoälykokemuksen ja uusia ominaisuuksia RAM-hallinnan optimoinnin ansiosta.
Viitteet:
https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
https://x.com/TechCrunch/status/1823410187404743131
https://venturebeat.com/ai/googles-ai-surprise-gemini-live-speaks-like-a-human-taking-on-chatgpt-advanced-voice-mode/
https://www.androidauthority.com/google-tensor-g4-explained-3466184/