notícias

A versão do Google dela foi derrubada: foram necessárias três tentativas e troca de telefone antes de ter sucesso... Internauta: Levo apenas 10 segundos para fazer isso manualmente

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jin Lei vem do Templo Aofei
Qubits | Conta pública QbitAI

Capotamento, grande capotamento.

Esta manhã, a versão Google dela—Gêmeos ao vivoOficialmente lançado.

Afinal, é obviamente uma referência para o GPT-4o da OpenAI, que pode-se dizer que atraiu a atenção do círculo tecnológico.

Na demo divulgada no site oficial,Perguntas e respostas sobre fotosO efeito da função é este:



A função geral que implementa é usar o celular para tirar fotos dos pôsteres dos shows, e deixar o Gemini verificar a agenda do usuário para ver se a programação é adequada para participação.

E você também pode realizar uma série de operações subsequentes com base nisso, incluindo verificação de tarifas em horário fixo, etc.

No entanto... quando se tratou da sessão de demonstração no local da conferência de imprensa, o estilo da pintura mudou completamente.

Por favor, assista ao videocassete:



Endereço do vídeo: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

  • Primeira vez: falhou.
  • Segunda vez: falhou.
  • Terceira vez: troquei de telefone e deu certo.

Hmm... A expressão do irmão mais novo é de um pouco de pânico a olho nu.



Até mesmo a conhecida mídia tecnológica TechCrunch incluiu os seguintes emojis:



Alguns internautas até ativaram o modo de comentários quentes:

Posso pesquisar minha agenda em 10 segundos.



Claro, este é apenas um pequeno episódio de Made by Google hoje.

Para mais informações sobre o Gemini Live, continuemos lendo abaixo.

A imagem completa da versão dela do Google

Como acabamos de mencionar, as funções do Gemini Live e do GPT-4o são muito semelhantes.

Além de “perguntas e respostas sobre fotos”, ele também pode conduzir conversas em tempo real e até interromper o Gemini durante o processo de resposta.

Entende-se que as funções do Gemini Live estão atualmente abertas para assinantes Advanced no sistema Android (somente em inglês).

Nas próximas semanas, esse recurso será expandido para mais idiomas e disponibilizado para iOS.

existirsom de diálogoPor outro lado, Gemini Live lançou10 tiposNovos sons estão disponíveis para seleção e o efeito é o seguinte:



Endereço do vídeo: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

existiroperarPor outro lado, como o Gemini está totalmente integrado ao sistema, ele pode ser invocado simplesmente pressionando e segurando o botão liga / desliga ou dizendo “Ei Google”.

Por exemplo, ao escrever um e-mail, deixe o Gemini ajudá-lo a gerar uma imagem correspondente. O efeito é o seguinte:



No entanto, a mídia estrangeira tem críticas mistas sobre esse recurso.

Por exemplo, um escritor do The Verge escreveu emTeste pessoalO título dado mais tarde é——

Gemini Live é mais rápido que o Google, mas mais estranho.



O motivo específico foi que o sistema de áudio do carro do autor falhou repentinamente durante uma viagem de três dias.

Encontrar uma solução usando o Google Assistant original levou pelo menos cinco minutos, mas o Gemini Live levou apenas 15 segundos.

No entanto, a fala contínua do Gemini Live durante a conversa e o método de interação que exige que os usuários interrompam ativamente deixaram o autor envergonhado.

Ele acredita:

A voz e a maneira de falar são tão humanas que me sinto desconfortável em interrompê-las.
Há mais emoção investida na interação com o Gemini Live do que em usá-lo como uma ferramenta de resolução de problemas.

Coincidentemente, para Gemini Live inExecute na nuvemO Wall Street Journal também fez uma avaliação contundente sobre este ponto——

Progresso no diálogo, regressão na funcionalidade.



Especificamente no nível técnico, o GPT-4o é um sistema ponta a ponta, mas a julgar pelo conteúdo divulgado pelo Google, o Gemini Live não é o caso.

Em vez disso, os sistemas STT, VAD, LLM e TTS são integrados:



Além disso, o Gemini Live também aparece na nova série de celulares Pixel lançada pelo Google.

Incluindo Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro e Pixel 9 Pro XL.



Em termos de funções de IA, os telefones Pixel do Google adicionaram um recurso chamado"Me adicione"função.

A realidade aumentada (AR) e a tecnologia de IA podem ser usadas para “rechear” personagens em duas fotos diferentes.



Por que o Google não consegue alcançar o OpenAI?

Embora o lançamento do Gemini Live pelo Google desta vez seja uma resposta ao OpenAI GPT-4o, desde o início da era dos modelos grandes, podemos ver uma tendência muito óbvia——

O Google não consegue acompanhar o OpenAI.

Primeiro, o OpenAI se tornou pioneiro no ponto mais crítico do lançamento do ChatGPT, mas o Google posteriormente lançou o Bard, que desta vez era muito semelhante ao Gemini Live, e posteriormente foi derrubado.

No último ano e meio, parece que a OpenAI liderou o lançamento de todos os principais modelos e aplicações.

Por outro lado, no Google, não só a tecnologia mostra um ritmo lento, mesmo em termos de opinião pública, a OpenAI ofuscou o maior evento anual do Google (conferência I/O) com notícias de uma mudança de pessoal (demissão de Ilya).

Então, por que o Google está falhando na era dos modelos grandes?

A respeito disso,Ex-CEO do GoogleEric Schmidt (que serviu de 2001 a 2011) expressou suas opiniões em seu último discurso em Stanford:

O Google atribui grande importância ao equilíbrio entre vida pessoal e profissional, permitindo, por exemplo, que os funcionários trabalhem em casa.
Mas nas startups, eles trabalham muito.



Endereço do vídeo: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

Alguns internautas até deram a notícia:

Meu irmão é um importante programador de IA no Google. Ele tem três empregos em tempo integral e passa apenas 2 horas por dia no Google.



Então, o que você acha disso, deixe uma mensagem na área de comentários para discutirmos.

Links de referência:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones