Le mie informazioni di contatto
Posta[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Autore |.Xinxin
modificare |.Jingyu
Un mese prima di Apple, Google ha dimostrato tutte le possibilità dei telefoni AI+ nel suo nuovo telefono Pixel.
Il 13 agosto, ora locale, Google ha rilasciato nuovi prodotti hardware come Pixel 9, Pixel 9 Pro, lo schermo pieghevole di seconda generazione Pixel 9 Fold, orologi intelligenti e cuffie. Rispetto all’hardware, le persone sono più preoccupate di come Google, in quanto gestore del sistema Android, utilizzerà l’intelligenza artificiale sul dispositivo per i telefoni Android quando i telefoni cellulari AI+ sono così popolari.
Quasi 10 mesi fa, Google ha lanciato la prima generazione di telefoni cellulari AI. Ora, meno di un anno fa, il colosso ha nuovamente aggiornato il suo portafoglio di prodotti Gemini, Android e Pixel. Questa volta l'obiettivo principale è "Ho quello che ho i concorrenti hanno." "modello.
Da quando OpenAI ha lanciato la modalità vocale ChatGPT e sono state svelate le funzioni AI dell'iPhone di prossima generazione di Apple, Google non è disposta a restare indietro in ciò che possono fare i suoi pari, comprese le conversazioni vocali AI, la ricerca di informazioni negli screenshot, ecc. Allo stesso tempo, Google sta anche integrando ulteriormente l’intelligenza artificiale nel proprio ecosistema applicativo.
Chi è il leader dei telefoni cellulari AI? Google deve competere con Apple.
In risposta a OpenAI,
Gemini Live è online
Gemini è la pietra angolare dei vari prodotti di intelligenza artificiale di Google e l'assistente predefinito sui telefoni cellulari della serie Pixel 9 di Google. Gli aggiornamenti di Gemini quando integrati nei telefoni cellulari sono stati al centro dell'attenzione della conferenza.
I Gemelli sui telefoni Google Pixel possono essere evocati premendo il pulsante di accensione. A partire da oggi, secondo i dirigenti di Google, gli utenti potranno visualizzare gli overlay Gemini sopra le app che utilizzano per porre domande su cosa c'è sullo schermo. Ad esempio, gli utenti possono porre domande su un video di YouTube che stanno guardando oppure possono generare immagini direttamente dagli overlay di Gemini e trascinarle in app come Gmail e Google Messaggi.
Google prevede inoltre di connettere Gemini a più app "nelle prossime settimane", tra cui Calendar, Keep e YouTube Music. Le caratteristiche specifiche includono chiedere a Gemini di "creare una playlist di canzoni che mi ricordino la fine degli anni '90". "Scatta una foto del volantino di un concerto e chiedi a Gemini di verificare la disponibilità quel giorno, persino di impostare promemoria per acquistare i biglietti". trova una ricetta in Gmail e chiedigli di aggiungere gli ingredienti alla tua lista della spesa in Keep."
Gemini utilizza gli screenshot per estrarre informazioni e interagire con più app |. Fonte immagine: Google
Oltre a queste esperienze integrate, Google ha anche lanciato ufficialmente Gemini Live. Questa funzionalità può essere considerata la risposta di Google alla modalità vocale avanzata GPT-4o lanciata da OpenAI. Questa funzionalità è stata precedentemente illustrata alla I/O Developer Conference di Google del 2024 e sarà lanciata ufficialmente oggi.
Gli utenti possono utilizzare i propri telefoni cellulari per condurre conversazioni vocali con Gemini, il chatbot AI generativo di Google. Possono interrompere a metà e porre domande di follow-up, e la conversazione può essere messa in pausa e ripresa in qualsiasi momento. Alcuni esempi di usi specifici includono lasciare che Gemini Live ti accompagni nella preparazione per colloqui di lavoro, discorsi pratici e chiacchierate casualmente su argomenti che ti interessano.
Gemini Live mira ovviamente a valutare l'interazione vocale di GPT-4o|Fonte immagine: Google
Quindi, Gemini Live presenta dei vantaggi rispetto alla modalità vocale di ChatGPT?
Si dice che l'architettura del modello di intelligenza artificiale generativa che supporta Live - Gemini 1.5 Pro e Gemini 1.5 Flash, abbia una "finestra di contesto" più lunga della media, il che significa che possono elaborare e ragionare su grandi quantità di dati prima di generare una risposta teoria Le conversazioni possono durare ore.
Gemini Live funziona anche a mani libere, consentendo agli utenti di continuare le conversazioni vocali in background dell'app o quando il telefono è bloccato, con 10 nuove voci tra cui scegliere.
Tuttavia, vale la pena notare che Gemini Live non ha ancora lanciato la funzione "input multimodale", che si dice verrà lanciata "entro la fine dell'anno".
Alcuni mesi fa, Google ha pubblicato un video preregistrato che mostra come Gemini Live sia in grado di riconoscere l'ambiente circostante l'utente attraverso foto e video catturati dalla fotocamera del telefono e rispondere, ad esempio segnalando una parte rotta della bicicletta o spiegando cosa stava succedendo sullo schermo di un computer . La funzionalità di un pezzo di codice, nessuno dei quali è stato dimostrato dal vivo.
Inoltre, Gemini Live è disponibile per gli abbonati Gemini Advanced su telefoni Android e non è gratuito. Al momento è disponibile solo in inglese, ma Google afferma che si espanderà in più lingue "nelle prossime settimane" e su iOS tramite un'app.
Dimostrazione trasmessa in diretta dai dirigenti di Google Gemini Live|Fonte immagine: Google
Un esperto di Google Gemini e un dirigente di Google Assistant hanno affermato: "Google è nelle prime fasi di esplorazione dei modi in cui gli assistenti basati sull'intelligenza artificiale possono essere utili e, proprio come i telefoni Pixel, Gemini migliorerà sempre di più".
Inoltre, in termini di problemi di privacy, i dirigenti dell'ecosistema Android di Google hanno affermato che Gemini supporta centinaia di modelli di telefoni cellulari di decine di produttori di dispositivi e durante l'elaborazione dei dati degli utenti, i dati non lasceranno il telefono.
"Gemini può aiutarti a creare un piano di allenamento quotidiano basato su un'e-mail del tuo personal trainer o scrivere un profilo lavorativo utilizzando il tuo curriculum su Google Drive. Solo Gemini può fare tutto in questo modo sicuro e all-in-one, senza la necessità di I dati vengono consegnati a un fornitore di intelligenza artificiale di terze parti che potresti non conoscere o di cui non ti fidi", ha affermato Sameer Samat, presidente dell'ecosistema Android di Google.
"Poiché Android è il primo sistema operativo mobile a disporre di un ampio modello di intelligenza artificiale multimodale sul dispositivo, chiamato Gemini Nano, i tuoi dati non lasciano mai il tuo telefono mentre gestisci alcuni dei casi d'uso più sensibili."
L'intelligenza artificiale è ulteriormente integrata in Android
Il più grande vantaggio di Google nel promuovere i telefoni AI sono senza dubbio i suoi molteplici strumenti applicativi e l'ecosistema Android di Google conta ora miliardi di utenti Android e ovviamente c'è più spazio per questo rispetto a un'applicazione chatbot.
L'anno scorso, come primo smartphone incentrato sull'intelligenza artificiale, la serie Pixel 8 di Google ha introdotto varie funzionalità AI. Ad esempio, gli utenti possono rimuovere, spostare o modificare singoli elementi in una foto, spostare le espressioni tra le foto per ottenere la migliore foto composita, effettuare ricerche in base agli screenshot o a una "parte cerchiata" dello schermo e altro ancora.
Tutte queste funzionalità sono apparse per la prima volta sulla serie Pixel 8 e da allora si sono diffuse in tutto l'ecosistema Android.
La funzione di “ricerca circolare” di Google è apparsa per la prima volta sul telefono Galaxy AI di Samsung In qualità di partner dell’ecosistema Android di Google, i telefoni Samsung hanno anche aggiunto molte funzionalità AI simili. Il già citato assistente AI Gemini appare anche nel Galaxy Z Fold6 di Samsung, nel Motorola Razr+ e in altri telefoni cellulari.
Allo stesso tempo, anche altri produttori hanno annunciato che lanceranno la propria intelligenza artificiale per telefoni cellulari. Quello che ha attirato maggiormente l'attenzione negli ultimi mesi è Apple. La stessa direzione e concetto è quella di integrare il proprio ecosistema di applicazioni.
In quasi un anno, si può dire che i "telefoni cellulari AI" siano diventati la prospettiva centrale della visione del mercato dei telefoni cellulari, non solo dei telefoni cellulari di Google. Come utilizzare l'intelligenza artificiale per far brillare le persone è una sfida per Google. Allo stato attuale, proprio come quando ha lanciato il telefono AI Pixel 8 di prima generazione, la maggior parte dei risultati di Google sono ancora vari gadget con funzioni AI.
All’evento Made By Google di quest’anno, le nuove funzionalità chiave dell’intelligenza artificiale di Google includono:
"Aggiungimi" permette anche a chi scatta la foto di inserirsi nella foto di gruppo;
"Pixel Studio", un generatore di immagini AI molto simile alla prossima app Image Playground di Apple;
"Pixel Screenshots", che scansiona la galleria di un utente alla ricerca di screenshot e li trasforma in un database facilmente ricercabile;
"Note sulle chiamate" può salvare un riepilogo delle informazioni nella cronologia delle chiamate. Dopo aver attivato questa funzione, tutti i partecipanti alla chiamata riceveranno una notifica.
Tra questi, se si desidera implementare la funzione "Aggiungimi", il fotografo prima scatta una foto senza se stesso, quindi un'altra persona diventa il fotografo e scatta un'altra foto. Pixel unirà le due foto per garantire che tutti siano in un'unica foto, quindi non è necessario chiedere a un estraneo di scattare la foto.
Funzione foto di gruppo|Fonte immagine: Google
Un importante punto di forza del posizionamento della serie Pixel 9 da parte di Google è anche la fotocamera AI, che si autodefinisce "la prima fotocamera al mondo basata sull'intelligenza artificiale". I dirigenti di Google hanno anche affermato che "Pixel è stato il primo telefono a utilizzare Night Sight in foto e video, e ora è anche il primo telefono a catturare splendidi paesaggi panoramici e paesaggi urbani in ambienti scarsamente illuminati". ha confrontato le foto scattate dal Pixel 9 Pro XL con l'iPhone 15 Pro Max di Apple.
Effetto fotografia notturna tra telefono cellulare Google e telefono cellulare Apple|Fonte: Google
Il Pixel 9 Pro Fold pieghevole con schermo ultra-grande ha anche una funzione "Made You Look" che può essere utilizzata per attirare l'attenzione degli utenti e farli sorridere davanti alla fotocamera. Quando si utilizza questa funzione, aprire il telefono e su un lato dello schermo esterno verrà riprodotta un'animazione visiva accattivante, ad esempio un pollo giallo brillante o altre animazioni divertenti.
Funzionalità dello schermo che attirano l'attenzione degli utenti|Fonte immagine: Google
Dopo aver scattato una foto, ci sono anche strumenti di fotoritocco e quest'anno Magic Editor di Google Foto ha lanciato alcune nuove funzionalità. Ad esempio, la funzione "Auto Frame" viene utilizzata per correggere l'angolo delle foto inclinate, mentre si utilizza l'intelligenza artificiale generativa per riempire gli spazi vuoti attorno al soggetto per creare un campo visivo più ampio. C'è anche una funzione "Reimagine" Dopo aver descritto l'effetto desiderato nella casella di testo, puoi utilizzare l'intelligenza artificiale generativa per l'immagine P, ad esempio trasformando l'erba sul terreno in fiori di campo, aggiungendo una mongolfiera in una determinata parte dell'immagine. cielo, ecc.
Inoltre, Google ha seguito le orme di Apple e ha lanciato una funzione "SOS satellitare" da utilizzare in caso di emergenza. Questa funzione consente agli utenti di contattare i soccorritori e condividere informazioni sulla posizione quando non è disponibile un servizio cellulare. Secondo i dirigenti di Google, la serie Pixel 9 sarà "i primi telefoni Android in grado di utilizzare l'SOS satellitare".
Funzione SOS satellitare |Fonte immagine: Google
Da un punto di vista funzionale la combinazione Pixel 9+ Gemini non è molto superiore agli attuali produttori nazionali di Android in termini di intelligenza artificiale. Ma va notato che, a differenza di Apple, Google dispone di propri sistemi e terminali, nonché di modelli di grandi dimensioni e di cloud computing. Attualmente è l'unica azienda tra tutte le aziende che ha veramente completato un ciclo chiuso nel "soft, hard e nuvola centrale".
Una volta che ci sarà una svolta nell’intelligenza artificiale dei terminali, Google, che è pronta a tutto, avrà molte più possibilità di “rendere di nuovo grande” rispetto ai suoi concorrenti.
Forse ciò che manca a Google è solo una maggiore ambizione.
*Fonte dell'immagine dell'intestazione: Google
Questo articolo è un articolo originale di Geek Park Per la ristampa, contattare Geek Jun su WeChat geekparkGO