Minhas informações de contato
Correspondênciaadmin@informação.bz
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Ainda no X, um grupo de pessoas foi fodido pelo Irmão MorangoIA abertaPré-visualização, quando você tem uma mentalidade maluca.
O Google carregaFeito pelo Google24A conferência de imprensa está aqui.
A OpenAI até postou um blog alguns minutos depois da coletiva de imprensa para atacar o Google. Era um blog tão ruim, e eles até deixaram seu AI Strawberry agir como o Charada por dois dias.
O OpenAI atual é realmente como um lobo chorando. Não tenho mais expectativas nem confiança nele. Os únicos dois palavrões que saíam todas as vezes eram XXX, XX!
E o Google ainda tem algumas surpresas extras sem nenhuma expectativa.
Resumi 11 destaques. Depois de ler este artigo, você terminou de assistir à coletiva de imprensa.
1. O Google quer reconstruir o Android baseado no Gemini.
Eles definiram uma palavra chamada AI OS. O Google quer levar AI OS para todos.
Atualmente eles suportam 45 idiomas em mais de 200 países e regiões, podem ser usados em centenas de modelos de telefones celulares de dezenas de fabricantes de dispositivos e são suportados em bilhões de dispositivos em todo o mundo.
2. O reconhecimento de imagem de Gêmeos no celular foi anulado.
A primeira coisa que demonstraram foram as capacidades de reconhecimento de imagem do Gemini.
Como uma IA multimodal, o reconhecimento de captura de imagem parece se tornar uma função obrigatória. O melhor teste de capacidade de reconhecimento de fotos é o conteúdo com muitas informações, como instruções e horários de filmagem. É necessário não apenas reconhecer a imagem, mas também compreender o conteúdo do texto e dar a resposta.
O cara que fez a demonstração tirou uma fotocartaz de concerto de papel, programação da turnê acima. O apresentador pediu que Gêmeos verificasse sua agenda e escolhesse um horário em que poderia ir ao show de Sabrina Carpenter.
No entanto, é provável que haja erros nas demonstrações ao vivo, e aí vem.
Nas duas primeiras vezes que Gemini tirou fotos, a demonstração ao vivo falhou vergonhosamente. Do outro lado do Oceano Pacífico, me senti estranho no local, duas vezes. . . = =
Esta demonstração também mencionou especificamente que foi utilizado o telemóvel Samsung Galaxy S24 Ultra. Será que a Samsung estava a exercer a sua força?
A cena foi alterada para outro dispositivo e tentada novamente. Felizmente, o conteúdo da imagem foi reconhecido com sucesso pela terceira vez.
Gêmeos deu diretamente uma data bem específica: Sabrina estará lá9 de novembro de 2024Chegue em São Francisco e vá a um show se o apresentador não tiver outros planos para o dia.
Os aplausos finalmente começaram e os rapazes deram um suspiro de alívio visivelmente.
3. A interação entre softwares é muito conveniente.
O Gemini agora pode compreender e analisar o conteúdo do vídeo diretamente no seu telefone.
Enquanto assiste ao vídeo, você pode ligar para Gemini para resumir os pontos principais ou tirar suas dúvidas sobre o conteúdo do vídeo.
Por exemplo, depois de assistir a um vídeo de comida no YouTube à noite, você não precisa ler as imagens uma por uma. Uma lista de alimentos que aparecem no vídeo é gerada automaticamente e adicionada à lista pessoal de “experimentar” do usuário. .
Boas notícias para os gourmets.
E você pode criar listas de atrações ou sugestões de roteiros para alguns vídeos de viagens no YouTube.
Como alguém que precisa aparecer no BGM mesmo quando está passeando,
Você também pode pedir a Gêmeos para criar uma “lista de reprodução de K-pop adequada para caminhar em Seul”, que recomenda músicas apropriadas com base na cena, humor ou tipo de atividade descrita pelo usuário.
Torna a localização de músicas mais intuitiva e pessoal.
4A velocidade de escrita é muito rápida e o efeito é bom.
Gemini também pode ajudá-lo a escrever e-mails no seu celular em apenas alguns segundos.
O irmão mais novo demonstrou duas situações: a primeira foi escrever uma carta educada de lembrete à proprietária, informando-a para consertar o módulo de alimentação em casa.
A segunda é escrever uma carta pedindo desculpas ao professor por ter faltado ao trabalho por motivo de doença (parece que já fiz esse tipo de coisa antes).
Além disso, o Gemini também possui designs interativos que facilitam aos usuários o polimento de textos e o envio de e-mails.
Vendo que Gêmeos completou a carta de desculpas em apenas alguns segundos, quase não consegui conter o riso.
5. O efeito de conversa em tempo real do Gemini Live não é ruim, mas é apenas TTS de baixa latência.
O Google lançou um recurso de conversação em tempo real semelhante ao GPT4o que pode ser interrompido a qualquer momento. Eles o chamam de Gemini Live.
Existem 10 tons para escolher.
A garota da demonstração conversou por um longo tempo com Gemini Live. A qualidade do som é boa e o atraso é baixo o suficiente, mas na verdade parece um TTS de baixa latência, não o grande modelo multimodal nativo do GPT4o.
Como não há demonstração de compreensão e expressão emocional, de acordo com a urina do Google, se houver, com certeza vão demonstrar isso de forma louca. Além disso, em algumas respostas mais longas, o atraso ainda pode ser sentido claramente.
Portanto, na verdade, é uma conversa TTS de baixa latência.
Atualmente, está disponível apenas para assinantes do Gemini Advanced. Custa US$ 20 por mês e está disponível imediatamente.
6.Pixel 9 é o primeiro celular equipado com Gemini Nano multimodal.
Este é o modelo de IA no dispositivo mais poderoso já lançado em um telefone, três vezes mais poderoso do que a IA anterior usada no Pixel 8 Pro.
O processador do Pixel 9 (TPU e Tensor G4) pode gerar até 45 palavras em um segundo, duas vezes mais rápido que antes.
O Pixel 9 normal tem 12 GB de memória, enquanto a versão Pro tem mais memória com 16 GB. E o mais interessante sobre eles é que finalmente têm função de chamada via satélite. . .
Tudo o que posso dizer aqui é que estamos muito à frente!
Os produtos lançados desta vez incluem três telefones monobloco e um telefone dobrável. A linha regular inclui um Pixel 9 básico com tela de 6,3 polegadas, um Pixel 9 Pro XL com tela de 6,8 polegadas e um novo Pixel 9 Pro menor de 6,3 polegadas.
Para ser sincero, acho um pouco feio. . .
Há também uma nova tela dobrávelPixel 9 Pro dobrável.
Ainda mais feio. . .
7.As notas de chamada podem ajudá-lo a registrar informações importantes durante a chamada telefônica.
Agora, o “assistente de chamadas” do Pixel ficou mais poderoso, adicionando uma função “Call Notes”.
Depois de terminar a chamada, você receberá um resumo totalmente privado da chamada. Isso facilita o acesso a números de telefone, horários, detalhes e outras informações que você não quer esquecer, mesmo que não tenha papel e caneta durante a ligação.
Além disso, todo esse processo é executado localmente e basicamente não há problemas de privacidade.
O menino deu um exemplo. Ele estava pensando em mudar o estilo de cabelo recentemente, mas seu barbeiro não conseguia fazer o penteado que queria, então me recomendou outra barbearia.
Mas o problema é que ele esqueceu de anotar o telefone da loja. Com Call Notes, você pode rastrear facilmente.
7. A função de captura de tela semelhante ao Recall é um pouco estranha.
Há uma cena com a qual todos estão familiarizados: você vê algo em seu telefone que deseja lembrar. Talvez você escreva em sua mente ou faça uma captura de tela e salve.
Mas muitas vezes você esquece o que deseja lembrar ou não consegue encontrar quando precisa.
Então eles fizeram um novo produto.
Você pode usar IA para pesquisar rapidamente todas as imagens salvas. Por exemplo, se você tiver dezenas de fotos de bicicletas no seu celular, se você pesquisar por bicicletas, todas elas aparecerão.
Você também pode fazer perguntas mais complexas, como o preço de uma camiseta, e verá que o Pixel Screenshot não apenas encontrou a imagem original, mas também me forneceu uma resposta em linguagem natural com base nas informações da imagem.
8. Um Pixel Studio de desenho de IA local comum.
Todo smartphone Pixel 9 vem com o novo Pixel Studio, o primeiro gerador de imagens em um smartphone.
Acho que o efeito é apenas médio e utilizável.
Por exemplo, a fogueira na praia ao pôr do sol parece muito comum.
9. A câmera AI é ótima para tirar fotos de grupo.
A câmera Pixel é considerada a primeira câmera AI.
Não entendo a maioria dos parâmetros, mas essa cena fotográfica é muito interessante.
Muitas vezes não conseguimos tirar uma foto em grupo e sempre tem um amigo que quer ser o fotógrafo.
Ele usa uma interface simples na tela para guiá-lo na captura de fotos, permitindo que você entregue sua câmera a outra pessoa para trocar de lugar. Depois, você pode alinhar as pessoas na nova foto com base nos contornos da primeira foto e tirar outra foto. A imagem resultante combina as duas fotos, fazendo parecer que todos estão na mesma foto ao mesmo tempo.
É muito legal e resolve um grande problema ao tirar fotos.
10. Novos relógios e fones de ouvido.
Enviou um Pixel Watch 3.
Um fone de ouvido Pixelbuds Pro 2.
O fone de ouvido pode acordar Gêmeos e falar com ele a qualquer momento.
11. Compare o Projeto Aster do GPT4o.
O Projeto Aster foi revelado na conferência do Google há alguns meses, comparando diretamente o grande modelo multimodal nativo do GPT4o.
Agora, no Gemin Live, você também pode usá-lo no futuroÁster.
Por exemplo, você pode compartilhar sua câmera enquanto conversa com Gemini, para mostrar diretamente um problema que encontrou em um dever de casa de cálculo ou pedir ajuda na próxima etapa da montagem de móveis.
E os aplicativos que você mais usa estão integrados ao Gemini Live, para que ele possa ajudá-lo a realizar ações em conversas e mensagens, além de extrair informações de aplicativos como o Google Agenda.
Assim, você pode enviar mensagens de texto para seus vizinhos, compartilhar detalhes sobre uma empresa e verificar sua agenda de uma só vez diretamente no Gemini Live, sem precisar abrir outro aplicativo.
É um pouco legal, uma combinação de GPT4o + Apple.
É uma pena, ainda é um bolo.
Em termos de IA, a combinação com hardware é bastante interessante, pelo menos o Gemini Live não é futuro e pode ser usado hoje.
Ainda é muito melhor que o OpenAI, que só consegue desenhar bolos.
Espero que o Google fique cada vez melhor e elimine o OpenAI.
Agora que você leu isso, se você acha que é bom, fique à vontade para curtir, assistir e retuitar três vezes. Se quiser receber notificações o mais rápido possível, você também pode me dar uma estrela⭐. ~ Obrigado por ler meu artigo, até a próxima.
>/ Autor: Kazik, Wenwen, Xiaorui, Dawn_E