Le mie informazioni di contatto
Posta[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Rapporto sul cuore della macchina
Editore: Zenan, Chen Chen
Gemini Live esegue il benchmark GPT-4o e il bucket della famiglia di telefoni cellulari Google AI è online.
Prima che GPT-4o entrasse nell'iPhone, Google Gemini ha preso l'iniziativa e ha completato la versione mobile.
Nelle prime ore del mattino di mercoledì, mentre la gente attendeva con ansia lo "Strawberry Big Model" di OpenAI, Google ha rilasciato ufficialmente Gemini Live e una serie di prodotti hardware Pixel in occasione dell'evento Made by Google.
All'evento di oggi, Google ha condotto una dimostrazione dal vivo al 100% con sicurezza, anche se si sono verificati alcuni problemi minori.
Ho provato a utilizzare il telefono per leggere le immagini due volte (ma ho usato un Samsung), entrambe le volte non sono riuscite.
Ma come dice Google, siamo entrati nell’”era dei Gemelli”.
Dopo la serie Pixel 9, una serie di funzionalità Gemini AI rilasciate oggi appariranno anche su vari telefoni Android con Android 15.
Gemini Live: confronta GPT-4o e vai subito online
Gemini Live è un prodotto lanciato da Google per la modalità vocale avanzata OpenAI. Questa funzionalità è quasi identica a ChatGPT ed è stata precedentemente in fase di test alpha.
Gemini Live offre un'esperienza di conversazione mobile che consente agli utenti di avere conversazioni fluide con Gemini e persino di interrompere o cambiare argomento come una normale telefonata senza digitare.
Google lo descrive in un blog: Puoi parlare con Gemini Live (tramite l'app Gemini) e scegliere uno dei 10 nuovi suoni naturali a cui rispondere (OpenAI offre solo 3 suoni). Puoi anche parlare al tuo ritmo o interrompere a metà risposta e porre ulteriori domande, proprio come in una normale conversazione.
Testo:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e3 20f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd
Gemini Live può essere svegliato direttamente. Puoi continuare a parlare con Gemini quando l'applicazione è in esecuzione in background o il telefono è bloccato e la conversazione può essere messa in pausa e ripresa in qualsiasi momento.
Gemini Live sarà inoltre integrato con varie funzioni delle applicazioni Android (come Keep), migliorando così l'usabilità di Gemini.
A partire da oggi, Google distribuirà questa funzionalità agli utenti Gemini Advanced di telefoni Android solo in inglese e nelle prossime settimane la espanderà a iOS e a versioni in altre lingue.
Tuttavia, durante la dimostrazione dal vivo, Gemini Live ha fallito due volte quando il personale in loco ha chiesto informazioni sulla locandina del concerto, richiedendo al presentatore di cambiare telefono per funzionare correttamente. Nonostante ci siano stati alcuni intoppi durante la demo, alla fine ha avuto successo e Gemini Live ha estratto informazioni rilevanti dalle immagini e si è connesso al calendario, fornendo agli utenti risultati accurati.
Testo:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e3 20f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd
Vale la pena notare che, secondo il product manager Leland Rechis, Google non consente a Gemini Live di imitare suoni diversi da questi 10 suoni. Google potrebbe averlo fatto per evitare di entrare in conflitto con le leggi sul copyright. In precedenza OpenAI era stata denunciata da quest’ultima per aver utilizzato la voce della vedova.
Nel complesso, la funzionalità sembra un ottimo modo per approfondire un argomento in modo più naturale rispetto all'utilizzo di una semplice ricerca su Google. Google rileva che Gemini Live rappresenta un passo avanti per Project Astra, il modello di intelligenza artificiale multimodale che l'azienda ha presentato durante il Google I/O. Attualmente, Gemini Live supporta solo conversazioni vocali e Google spera di aggiungere in futuro funzionalità di comprensione dei video in tempo reale.
Benedizione del chip, l'hardware di Google sta arrivando
Contemporaneamente al lancio di Gemini Live, Google ha anche lanciato una nuova generazione di dispositivi hardware intelligenti prima di Apple e Huawei.
L'hardware appena rilasciato questa mattina include Pixel 9, Pixel 9 Pro e Pixel 9 Pro XL, oltre al telefono con schermo pieghevole Pixel 9 Pro Fold. Sono tutti alimentati dal nuovo chip Google Tensor G4, che può offrire varie capacità di intelligenza artificiale generativa .
I telefoni Pixel 9 presentano un nuovo look che mette la fotocamera in primo piano e al centro, migliorando l'iconico modulo fotocamera e migliorandone la sensazione in mano. Google afferma che questi telefoni sono due volte più durevoli del Pixel 8.
Questa volta, per la prima volta, i modelli Pixel Pro sono disponibili in due diverse dimensioni: Pixel 9 Pro (6,3 pollici) e Pixel 9 Pro XL (6,8 pollici), entrambi dotati di display Super Actua e fotocamere frontali da 42 MP. A parte le dimensioni del display, la velocità di ricarica e la batteria, Pixel 9 Pro e Pixel 9 Pro XL condividono specifiche e caratteristiche identiche.
Vale la pena notare che il telefono cellulare Pixel 9 utilizza il nuovo chip personalizzato Tensor G4 di Google. Si tratta di una nuova generazione di chip per telefoni cellulari ad alte prestazioni progettati per migliorare i casi di utilizzo quotidiano, come l'apertura più rapida delle app, la navigazione sul Web e altro ancora.
Tensor G4 è progettato da Google DeepMind, prodotto da Samsung e utilizza l'architettura Arm. G4 è ottimizzato per eseguire i modelli di intelligenza artificiale più avanzati. Sarà il primo processore a eseguire il modello multimodale Gemini Nano, consentendo ai modelli di grandi dimensioni di comprendere attività come testo, immagini e audio solo dal lato del telefono cellulare.
Dalle notizie attuali, Tensor G4 è uguale al suo predecessore, utilizza lo stesso core della tecnologia dell'attuale generazione, il che significa che presto diventerà un chipset arretrato a settembre. Il core GPU statico chiamato Mali significa anche che Ray tracing non lo è supportata (la versione supportata si chiama Immortalis). Nonostante questo, rispetto al sottoscritto, il miglioramento prestazionale rispetto al prodotto della generazione precedente è comunque notevole.
Naturalmente, essendo un chip sviluppato da DeepMind, Tensor G4 ha una buona potenza di calcolo dell'intelligenza artificiale. Google ha rivelato che ha una velocità di output "leader del settore" di 45 token al secondo.
Per garantire che l'esperienza AI sul dispositivo funzioni senza intoppi, Google ha anche aggiornato la memoria della serie Pixel 9, che viene fornita con 12 GB di RAM, mentre Pixel 9 Pro e Pixel 9 Pro XL sono dotati di 16 GB di RAM.
La serie Pixel è da sempre il punto di riferimento per le applicazioni tecnologiche di Google. I nuovi telefoni sono dotati di Gemini Live e saranno in vendita ad agosto. Google ha affermato che gli utenti di Pixel 9 Pro, Pixel 9 Pro XL e Pixel 9 Pro Fold potranno usufruire di un abbonamento Gemini Advanced di un anno dopo l'acquisto del telefono. Sembra che rispetto alla serie iPhone 16 dotata di modelli di grandi dimensioni OpenAI, Google questa volta abbia fatto un passo avanti.
Google ha introdotto una serie di funzionalità di intelligenza artificiale generativa per Pixel.
Tra questi, Pixel Studio può aiutarti a trasformare le idee in immagini sul tuo telefono. È composto da un modello di diffusione lato dispositivo in esecuzione su Tensor G4 e un modello da testo a immagine Imagen 3 nel cloud.
Il nuovo modello di immagine di Google, Imagen 3, è stato rilasciato per la prima volta alla conferenza I/O di maggio. Il modello è stato ottimizzato e aggiornato in termini di generazione di dettagli, illuminazione, interferenze, ecc. e la sua capacità di comprendere le istruzioni è stata notevolmente migliorata. Con la conferenza stampa di oggi, Google DeepMind ha presentato un articolo Imagen 3 su arXiv:
Pixel Screenshots ti aiuta a salvare, organizzare e richiamare informazioni importanti che desideri ricordare per dopo.
Diciamo che hai un'amica che ama gli scoiattoli e presto sarà il suo compleanno. Puoi cercare regali e acquisire screenshot di magliette di scoiattolo, sottobicchieri di scoiattolo e tutto ciò che riguarda gli scoiattoli su Google Chrome. Pixel Screenshots analizzerà il contenuto di tutte queste immagini e ti aiuterà a cercare queste informazioni nella tua app. Quindi, apri l'app e cerca "scoiattolo" e verranno visualizzati i risultati. Includerà anche collegamenti a tutto ciò che trovi, nonché un riepilogo e informazioni correlate sul contenuto che stai visualizzando.
Una delle cose più comuni che le persone fanno sul proprio telefono è controllare il meteo. Pixel Weather può fornire informazioni meteorologiche più accurate e Gemini Nano genererà anche rapporti meteorologici AI personalizzati per consentire alle persone di comprendere le condizioni meteorologiche della giornata.
In termini di scatto delle foto richieste da tutti i telefoni cellulari, Pixel 9 aggiunge funzioni di scatto AI per migliorare l'efficienza della produzione cinematografica.
Spesso nelle foto di gruppo manca un fotografo designato. Con Add Me puoi scattare foto con tutti i presenti nella stanza senza dover portare un treppiede o chiedere aiuto a estranei.
Con il Panorama riprogettato, ora puoi scattare foto dettagliate anche in condizioni di scarsa illuminazione. Questo è il panorama in condizioni di scarsa illuminazione della massima qualità disponibile su qualsiasi smartphone.
Inoltre, Magic Editor in Google Foto ha nuove funzionalità di modifica che ti consentono di scattare la foto che desideri. La funzione di inquadratura automatica può ricomporre la foto e devi solo inserire ciò che vuoi vedere (ad esempio: aggiungere fiori di campo in uno spazio vuoto). campo) Cioè puoi ricomporre le foto e trasformare le idee in realtà.
La registrazione intelligente delle chiamate dei modelli di grandi dimensioni è ora integrata anche nel sistema Android. La funzione Cancella chiamata migliora ulteriormente la qualità audio e la nuova funzione Note di chiamata invia un riepilogo privato e la trascrizione completa della chiamata non appena l'utente riattacca. Quindi, quando ricevi una chiamata, non è necessario affrettarsi a prendere carta e penna per prendere appunti. Per proteggere la privacy, la registrazione delle chiamate viene eseguita interamente sul dispositivo.
Gli ultimi dispositivi Pixel 9 sono i primi telefoni Android a disporre della nuova funzionalità SOS satellitare, quindi gli utenti possono contattare i soccorritori e condividere la propria posizione via satellite anche quando non è disponibile una rete mobile. Satellite SOS sarà disponibile prima sui dispositivi Pixel 9 negli Stati Uniti, indipendentemente dal piano del tuo operatore. Questa funzionalità sarà gratuita per i primi due anni su Pixel.
Infine, ci sono i prezzi Pixel 9, Pixel 9 Pro e Pixel 9 Pro XL sono tutti disponibili per il preordine, a partire rispettivamente da $ 799, $ 999 e $ 1.099. Pixel 9 e Pixel 9 Pro XL saranno disponibili il 22 agosto nel Google Store e nei partner commerciali di Google. Pixel 9 Pro sarà disponibile negli Stati Uniti il 4 settembre, mentre Pixel 9 Pro Fold sarà disponibile in altri mercati nelle prossime settimane.
Contenuto di riferimento:
https://blog.google/products/pixel/google-pixel-9-pro-xl/
https://www.androidauthority.com/google-tensor-g4-explained-3466184/