Le mie informazioni di contatto
Posta[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Proprio su X, un gruppo di persone è stato scopato dal fratello StrawberryIA apertaAnteprima, quando hai una mentalità folle.
Google trasportaRealizzato da Google24La conferenza stampa è qui.
OpenAI ha persino pubblicato un blog pochi minuti dopo la conferenza stampa per colpire Google. Era un pessimo blog e hanno persino lasciato che la loro AI Strawberry fungesse da Enigmista per due giorni.
L'attuale OpenAI è davvero come un lupo che piange, non ho più alcuna aspettativa o fiducia in esso. Le uniche due parolacce che uscivano ogni volta erano XXX, XX!
E Google ha ancora qualche sorpresa in più senza alcuna aspettativa.
Ho riassunto 11 punti salienti Dopo aver letto questo articolo, hai finito di guardare la conferenza stampa.
1. Google vuole ricostruire Android basato su Gemini.
Hanno definito una parola chiamata AI OS. Google vuole portare il sistema operativo AI a tutti.
Attualmente supportano 45 lingue in più di 200 paesi e regioni, possono essere utilizzati su centinaia di modelli di telefoni cellulari di decine di produttori di dispositivi ed è supportato su miliardi di dispositivi in tutto il mondo.
2. Il riconoscimento delle immagini dei Gemelli sul cellulare viene ribaltato.
La prima cosa che hanno dimostrato sono state le capacità di riconoscimento delle immagini di Gemini.
Essendo un'intelligenza artificiale multimodale, il riconoscimento dell'acquisizione di immagini sembra essere diventato una funzione indispensabile. Il miglior test della capacità di riconoscimento delle foto è il contenuto ad alta intensità di informazioni come istruzioni e programmi di ripresa. È necessario non solo riconoscere l'immagine, ma anche comprendere il contenuto del testo e fornire la risposta.
Il ragazzo che ha fatto la demo ha scattato una fotomanifesto cartaceo del concerto, programma del tour sopra. Il presentatore ha chiesto a Gemini di controllare il suo programma e di scegliere un orario in cui avrebbe potuto andare allo spettacolo di Sabrina Carpenter.
Tuttavia, è probabile che ci siano dei passi falsi nelle demo dal vivo, ed eccolo qui.
Le prime due volte in cui Gemini ha scattato foto, la dimostrazione dal vivo è fallita in modo imbarazzante. Dall'altra parte dell'Oceano Pacifico, mi sono sentito a disagio sulla scena, per due volte. . . = =
Questa dimostrazione ha anche menzionato specificamente che è stato utilizzato il telefono cellulare Samsung Galaxy S24 Ultra. Potrebbe essere che Samsung stesse esercitando la sua forza?
La scena è stata cambiata su un altro dispositivo e riprovata. Fortunatamente il contenuto dell'immagine è stato riconosciuto con successo per la terza volta.
I Gemelli hanno dato direttamente una data ben precisa: ci sarà Sabrina9 novembre 2024Arriva a San Francisco e vai a uno spettacolo se il presentatore non ha altri programmi per la giornata.
Finalmente sono iniziati gli applausi ed i ragazzi hanno tirato un visibilmente sospiro di sollievo.
3. L'interazione tra software è molto conveniente.
Gemini ora può comprendere e analizzare i contenuti video direttamente sul tuo telefono.
Mentre guardi il video, puoi chiamare Gemini per riassumere i punti chiave o rispondere alle tue domande sul contenuto del video.
Ad esempio, dopo aver guardato un video di cibo su YouTube di notte, non è necessario leggere le immagini una per una. L'elenco degli alimenti visualizzati nel video viene generato automaticamente e aggiunto all'elenco personale "da provare" dell'utente .
Buone notizie per i buongustai.
Inoltre, puoi creare elenchi di attrazioni o suggerimenti di itinerari per alcuni video di viaggio su YouTube.
Come qualcuno che ha bisogno di apparire nella musica di sottofondo anche mentre fa una passeggiata,
Puoi anche chiedere a Gemini di creare una "playlist K-pop adatta per passeggiare a Seul", che consigli la musica appropriata in base alla scena, all'umore o al tipo di attività descritta dall'utente.
Rende la ricerca della musica più intuitiva e personale.
4La velocità di scrittura è molto veloce e l'effetto è buono.
Gemini può anche aiutarti a scrivere email sul tuo cellulare in pochi secondi.
Il fratellino ha illustrato due scenari: il primo è stato quello di scrivere una lettera di promemoria educata al padrone di casa, invitandola a riparare il modulo di alimentazione a casa.
La seconda è scrivere una lettera di scuse al professore per l'assenza dal lavoro per malattia (mi sembra di aver già fatto cose del genere).
Inoltre, Gemini dispone anche di design interattivi che facilitano agli utenti la rifinitura del testo e l'invio di e-mail.
Vedendo che Gemini ha completato la lettera di scuse in pochi secondi, quasi non sono riuscita a trattenere le risate.
5. L'effetto di conversazione in tempo reale di Gemini Live non è male, ma è solo TTS a bassa latenza.
Google ha lanciato una funzionalità di conversazione in tempo reale simile a GPT4o che può essere interrotta in qualsiasi momento. La chiamano Gemini Live.
Ci sono 10 toni tra cui scegliere.
La ragazza della demo ha chiacchierato a lungo con Gemini Live. La qualità del suono è buona e il ritardo è abbastanza basso, ma in realtà sembra un TTS a bassa latenza, non il grande modello multimodale nativo di GPT4o.
Poiché non c'è alcuna dimostrazione di comprensione ed espressione emotiva, secondo l'urina di Google, se ce n'è una, lo mostreranno sicuramente in modo folle. Inoltre, in alcune risposte più lunghe, il ritardo può ancora essere chiaramente avvertito.
Quindi in realtà è una conversazione TTS a bassa latenza.
Attualmente è disponibile solo per gli abbonati Gemini Advanced Costa $ 20 al mese ed è immediatamente disponibile.
6.Pixel 9 è il primo telefono cellulare dotato di Gemini Nano multimodale.
Si tratta del modello di intelligenza artificiale su dispositivo più potente mai rilasciato su un telefono, tre volte più potente della precedente intelligenza artificiale utilizzata su Pixel 8 Pro.
Il processore di Pixel 9 (TPU e Tensor G4) può generare fino a 45 parole in un secondo, due volte più velocemente di prima.
La versione normale di Pixel 9 ha 12 GB di memoria, mentre la versione Pro ne ha di più, raggiungendo i 16 GB. E la cosa più interessante è che finalmente hanno la funzione di chiamata via satellite. . .
Tutto quello che posso dire qui è che siamo molto più avanti!
I prodotti rilasciati questa volta includono tre telefoni candy bar e un telefono pieghevole. La gamma normale include un Pixel 9 base con display da 6,3 pollici, un Pixel 9 Pro XL con schermo da 6,8 pollici e un nuovo Pixel 9 Pro più piccolo da 6,3 pollici.
Ad essere onesti, penso che sia un po' brutto. . .
C'è anche un nuovo paravento pieghevolePixel 9 Pro pieghevole.
Ancora più brutto. . .
7.Le note di chiamata possono aiutarti a registrare le informazioni chiave durante la telefonata.
Ora, l'"assistente alle chiamate" di Pixel è diventato più potente, aggiungendo una funzione "Note sulle chiamate".
Dopo aver terminato la chiamata, ti verrà fornito un riepilogo completamente privato della chiamata. Ciò semplifica l'accesso a numeri di telefono, orari, dettagli e altre informazioni che non vuoi dimenticare, anche se non hai carta e penna durante la chiamata.
Inoltre, questo processo viene eseguito localmente e sostanzialmente non ci sono problemi di privacy.
Il ragazzo ha fatto un esempio. Stava pensando di cambiare il suo stile di capelli di recente, ma il suo barbiere non poteva fare l'acconciatura che voleva, quindi mi ha consigliato ad un altro barbiere.
Ma il problema è che si è dimenticato di annotare il numero di telefono del negozio. Con le note sulle chiamate puoi risalire facilmente.
7. La funzione screenshot simile a Recall è un po' strana.
C'è una scena che tutti conoscono: vedi qualcosa sul tuo telefono che vuoi ricordare, forse lo scrivi nella tua mente o fai uno screenshot e lo salvi.
Ma spesso dimentichi ciò che vuoi ricordare o non riesci a trovarlo quando ne hai bisogno.
Poi hanno realizzato un nuovo prodotto.
Puoi utilizzare l'intelligenza artificiale per cercare rapidamente tutte le immagini salvate. Ad esempio, se sul telefono sono presenti decine di immagini di biciclette, se si cerca biciclette verranno visualizzate tutte.
Puoi anche porre domande più complesse, come il prezzo di una maglietta, e vedrai che Pixel Screenshot non solo ha trovato l'immagine originale, ma mi ha anche fornito una risposta in linguaggio naturale basata sulle informazioni presenti nell'immagine.
8. Un normale disegno AI locale Pixel Studio.
Ogni telefono Pixel 9 viene fornito con il nuovo Pixel Studio, il primo generatore di immagini su un telefono.
Penso che l'effetto sia solo nella media e utilizzabile.
Ad esempio, il falò sulla spiaggia al tramonto sembra molto ordinario.
9. La fotocamera AI è ottima per scattare foto di gruppo.
Si dice che la fotocamera Pixel sia la prima fotocamera AI.
Non capisco la maggior parte dei parametri, ma questa scena fotografica è molto interessante.
Molte volte non possiamo fare una foto di gruppo e c'è sempre un amico che vuole fare il fotografo.
Utilizza una semplice interfaccia su schermo per guidarti nello scatto di foto, ad esempio permettendoti di consegnare la fotocamera a qualcun altro in modo da poter scambiare di posto. Quindi, puoi allineare le persone nella nuova foto in base ai loro contorni nella prima foto e scattare un'altra foto. L'immagine risultante unisce le due foto insieme, facendo sembrare che tutti siano nella stessa foto contemporaneamente.
È molto interessante e risolve un importante punto dolente nello scattare foto.
10. Nuovi orologi e cuffie.
Ho inviato un Pixel Watch 3.
Un paio di cuffie Pixelbuds Pro 2.
L'auricolare può svegliare Gemini e parlargli in qualsiasi momento.
11. Confronta il progetto Aster di GPT4o.
Il progetto Aster è stato presentato alla conferenza di Google alcuni mesi fa, confrontando direttamente il grande modello multimodale nativo di GPT4o.
Ora, in Gemin Live, potrai utilizzarlo anche in futuroAster.
Ad esempio, puoi condividere la tua fotocamera mentre parli con Gemini, così puoi mostrare direttamente un problema che hai riscontrato durante un compito di calcolo o chiedere aiuto per il passaggio successivo dell'assemblaggio dei mobili.
E le app che usi di più sono integrate in Gemini Live, quindi può aiutarti a intervenire nelle conversazioni e nei messaggi e a estrarre informazioni da app come Google Calendar.
Quindi puoi inviare messaggi ai tuoi vicini, condividere dettagli su un'attività e controllare il tuo calendario allo stesso tempo direttamente da Gemini Live, senza dover aprire un'altra app.
È un po’ interessante, una combinazione di GPT4o + Apple.
È un peccato, è pur sempre una torta.
In termini di intelligenza artificiale, la combinazione con l'hardware è piuttosto interessante. Almeno Gemini Live non è un futuro e può essere utilizzato già oggi.
È comunque molto meglio di OpenAI, che può solo disegnare torte.
Spero che Google migliori sempre di più e uccida OpenAI.
Ora che l'hai letto, se pensi che sia bello, sentiti libero di mettergli un mi piace, guardarlo e ritwittarlo tre volte. Se vuoi ricevere notifiche il prima possibile, puoi anche darmi una stella⭐ ~Grazie per aver letto il mio articolo, alla prossima volta.
>/ Autore: Kazik, Wenwen, Xiaorui, Dawn_E