Le mie informazioni di contatto
Posta[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Jin Lei proviene dal Tempio Aofei
Qubit |. Account pubblico QbitAI
Ribaltamento, grande ribaltamento.
Stamattina presto, la versione Google di Her...Gemelli in direttaRilasciato ufficialmente.
Dopotutto si tratta ovviamente di un punto di riferimento per GPT-4o di OpenAI, che si può dire abbia attirato l'attenzione del circolo tecnologico.
Nella demo rilasciata sul sito ufficiale,Domande e risposte fotograficheL'effetto della funzione è questo:
La funzione generale che implementa è quella di utilizzare il cellulare per scattare foto dei manifesti dei concerti e consentire a Gemini di controllare il calendario dell'utente per vedere se il programma è adatto alla partecipazione.
E in base a questo puoi anche eseguire una serie di operazioni successive, tra cui il controllo delle tariffe ad un orario prestabilito, ecc.
Tuttavia... quando si è arrivati alla sessione dimostrativa della conferenza stampa, lo stile del dipinto è cambiato completamente.
Si prega di guardare il videoregistratore:
Indirizzo del video: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Hmm... L'espressione del fratellino è un po' in preda al panico a occhio nudo.
Anche il noto media tecnologico TechCrunch ha incluso tali emoji:
Alcuni netizen hanno addirittura attivato la modalità commenti hot:
Posso cercare nel mio calendario in 10 secondi.
Naturalmente questo è solo un piccolo episodio di Made by Google di oggi.
Per ulteriori informazioni su Gemini Live, continuiamo a leggere di seguito.
Come abbiamo appena accennato, le funzioni di Gemini Live e GPT-4o sono molto simili.
Oltre alle "domande e risposte sulle foto", può anche condurre conversazioni in tempo reale e persino interrompere Gemini durante il processo di risposta.
Resta inteso che le funzionalità di Gemini Live sono attualmente aperte agli abbonati Advanced sul sistema Android (solo inglese).
Nelle prossime settimane questa funzionalità verrà estesa a più lingue e resa disponibile su iOS.
esisteresuono del dialogoD'altra parte, è stato lanciato Gemini Live10 tipiSono disponibili nuovi suoni da selezionare e l'effetto è il seguente:
Indirizzo del video: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
esistereoperareD'altra parte, poiché Gemini è completamente integrato nel sistema, può essere richiamato semplicemente tenendo premuto il pulsante di accensione o dicendo "Ehi Google".
Ad esempio, quando scrivi un'e-mail, lascia che Gemini ti aiuti a generare un'immagine corrispondente. L'effetto è il seguente:
Tuttavia, i media stranieri hanno opinioni contrastanti su questa funzionalità.
Ad esempio, uno scrittore di The Verge ha scrittoProva personaleIl titolo dato in seguito è——
Gemini Live è più veloce di Google, ma più scomodo.
Il motivo specifico era che l'impianto audio dell'auto dell'autore si è guastato improvvisamente durante un viaggio di tre giorni.
Trovare una soluzione utilizzando l'Assistente Google originale ha richiesto almeno cinque minuti, ma Gemini Live ha impiegato solo 15 secondi.
Tuttavia, il discorso continuo di Gemini Live durante la conversazione e il metodo di interazione che richiede agli utenti di interrompere attivamente hanno fatto sentire l’autore in imbarazzo.
Egli crede:
La voce e il modo di parlare sono così umani che mi sento a disagio a interromperli.
C'è più emozione investita nell'interazione con Gemini Live che nell'usarlo come strumento per la risoluzione dei problemi.
Per coincidenza, per Gemini Live inCorri nel cloudAnche il Wall Street Journal ha dato una valutazione severa su questo punto——
Progresso nel dialogo, regressione nella funzionalità.
Specifico a livello tecnico, GPT-4o è un sistema end-to-end, ma a giudicare dai contenuti rilasciati da Google, Gemini Live non è il caso.
Sono invece integrati i sistemi STT, VAD, LLM e TTS:
Inoltre, Gemini Live appare anche nella nuova serie di telefoni cellulari Pixel rilasciata da Google.
Compresi Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro e Pixel 9 Pro XL.
In termini di funzioni AI, i telefoni Pixel di Google hanno aggiunto una funzionalità chiamata"Aggiungimi"funzione.
La realtà aumentata (AR) e la tecnologia AI possono essere utilizzate per "riempire" insieme i personaggi in due foto diverse.
Sebbene il rilascio di Gemini Live da parte di Google questa volta sia una risposta a OpenAI GPT-4o, da quando è iniziata l'era dei modelli di grandi dimensioni, possiamo vedere una tendenza molto evidente:
Google non riesce a tenere il passo con OpenAI.
Innanzitutto, OpenAI è diventato pioniere nel momento più critico del rilascio di ChatGPT, ma Google ha successivamente rilasciato Bard, che questa volta era molto simile a Gemini Live, e successivamente ha ribaltato.
Nell'ultimo anno e mezzo, sembra che OpenAI abbia guidato il rilascio di tutti i principali modelli e applicazioni.
D'altra parte, in Google, non solo la tecnologia mostra un ritmo lento; anche in termini di opinione pubblica, OpenAI ha messo in ombra il più grande evento annuale di Google (conferenza I/O) con la notizia di un cambio di personale (dimissioni di Ilya).
Allora perché Google sta fallendo nell’era dei grandi modelli?
A questo proposito,Ex amministratore delegato di GoogleEric Schmidt (in servizio dal 2001 al 2011) ha espresso le sue opinioni nel suo ultimo discorso a Stanford:
Google attribuisce grande importanza all’equilibrio tra lavoro e vita privata, ad esempio consentendo ai dipendenti di lavorare da casa.
Ma nelle startup lavorano davvero duramente.
Indirizzo del video: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
Alcuni netizen hanno addirittura dato la notizia:
Mio fratello è uno dei migliori programmatori di intelligenza artificiale di Google. Ha 3 lavori a tempo pieno e trascorre solo 2 ore al giorno su Google.
Quindi cosa ne pensi, per favore lascia un messaggio nell'area commenti per discuterne.
Link di riferimento:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones