noticias

De la noche a la mañana, se lanzaron la versión de Google de GPT-4o y los teléfonos AI

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Informe del corazón de la máquina

Editor: Zenan, Chen Chen

Gemini Live compara GPT-4o y el grupo de la familia de teléfonos móviles Google AI está en línea.

Antes de que GPT-4o ingresara al iPhone, Google Gemini tomó la iniciativa y completó la versión móvil.

Temprano en la mañana del miércoles, cuando la gente esperaba con ansias el "Strawberry Big Model" de OpenAI, Google lanzó oficialmente Gemini Live y una serie de productos de hardware Pixel en el evento Made by Google.



En el evento de hoy, Google realizó una demostración 100% en vivo con confianza, aunque hubo algunos problemas menores.



Intenté usar mi teléfono para leer imágenes dos veces (pero usé un Samsung), ambas veces fallaron.

Pero como dice Google, hemos entrado en la "era Géminis".

Después de la serie Pixel 9, una serie de funciones de Gemini AI lanzadas hoy también aparecerán en varios teléfonos Android con Android 15.

Gemini Live: compare GPT-4o y conéctese inmediatamente

Gemini Live es un producto lanzado por Google para el modo de voz avanzado OpenAI. Esta función es casi idéntica a ChatGPT y ha estado en la etapa de prueba alfa anteriormente.



Gemini Live proporciona una experiencia de conversación móvil que permite a los usuarios tener conversaciones fluidas con Gemini e incluso interrumpir o cambiar de tema como en una llamada telefónica normal sin escribir.

Google lo describe en un blog: puedes hablar con Gemini Live (a través de la aplicación Gemini) y elegir uno de los 10 nuevos sonidos naturales al que responder (OpenAI solo ofrece 3 sonidos). Incluso puedes hablar a tu propio ritmo o interrumpir a mitad de una respuesta y hacer preguntas adicionales, como en una conversación normal.



https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e320 f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Gemini Live se puede activar directamente. Puede continuar hablando con Gemini cuando la aplicación se está ejecutando en segundo plano o el teléfono está bloqueado, y la conversación se puede pausar y reanudar en cualquier momento.

Gemini Live también se integrará con varias funciones de aplicaciones de Android (como Keep), mejorando así la usabilidad de Gemini.



A partir de hoy, Google está implementando esta función para los usuarios de teléfonos Android Gemini Advanced solo en inglés, y se expandirá a iOS y a más versiones de idiomas en las próximas semanas.



Sin embargo, durante la demostración en vivo, Gemini Live falló dos veces cuando el personal en el lugar pidió información sobre el cartel del concierto, lo que obligó al presentador a cambiar su teléfono para que funcionara correctamente. Aunque hubo algunos contratiempos durante la demostración, finalmente fue exitosa y Gemini Live terminó extrayendo información relevante de las imágenes y conectándose al calendario, brindando a los usuarios resultados precisos.



https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e320 f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Vale la pena señalar que, según el gerente de producto Leland Rechis, Google no permite que Gemini Live imite ningún sonido distinto de estos 10 sonidos. Es posible que Google haya hecho esto para evitar infringir las leyes de derechos de autor. Anteriormente, OpenAI fue demandada por este último por utilizar la voz de la viuda.

En general, la función parece una excelente manera de profundizar en un tema de manera más natural que mediante una simple búsqueda en Google. Google señala que Gemini Live es un paso adelante para el Proyecto Astra, el modelo de IA multimodal que la compañía presentó durante Google I/O. Actualmente, Gemini Live solo admite conversaciones de voz y Google espera agregar capacidades de comprensión de video en tiempo real en el futuro.

Bendición del chip, el hardware de Google está por llegar

Al mismo tiempo que se lanzó Gemini Live, Google también lanzó una nueva generación de dispositivos de hardware inteligentes antes que Apple y Huawei.

El hardware recién lanzado esta mañana incluye Pixel 9, Pixel 9 Pro y Pixel 9 Pro XL, así como un teléfono con pantalla plegable Pixel 9 Pro Fold. Todos funcionan con el nuevo chip Google Tensor G4, que puede brindar varias capacidades de IA generativa. .

Los teléfonos Pixel 9 presentan una nueva apariencia que coloca la cámara al frente y al centro, mejorando el módulo de cámara icónico y mejorando su sensación en la mano. Google afirma que estos teléfonos son dos veces más duraderos que el Pixel 8.



Esta vez, por primera vez, los modelos Pixel Pro están disponibles en dos tamaños diferentes: Pixel 9 Pro (6,3 pulgadas) y Pixel 9 Pro XL (6,8 pulgadas), ambos equipados con pantallas Super Actua y cámaras frontales de 42 MP. Aparte del tamaño de la pantalla, la velocidad de carga y la batería, Pixel 9 Pro y Pixel 9 Pro XL comparten especificaciones y características idénticas.



Vale la pena señalar que el teléfono móvil Pixel 9 utiliza el nuevo chip personalizado Tensor G4 de Google. Se trata de una nueva generación de chips para teléfonos móviles de alto rendimiento diseñados para mejorar los casos de uso cotidianos, como abrir aplicaciones más rápido, navegar por Internet y más.



Tensor G4 está diseñado por Google DeepMind, fabricado por Samsung y utiliza la arquitectura Arm. G4 está optimizado para ejecutar los modelos de inteligencia artificial más avanzados. Será el primer procesador que ejecutará el modelo multimodal Gemini Nano, lo que permitirá a los modelos grandes comprender tareas como texto, imágenes y audio sólo en el lado del teléfono móvil.



Según las noticias actuales, Tensor G4 es el mismo que su predecesor, utilizando el mismo núcleo que la tecnología de generación actual, lo que significa que pronto se convertirá en un conjunto de chips atrasado en septiembre. El núcleo de GPU estático llamado Mali también significa que el trazado de rayos no lo es. compatible (la versión compatible se llama Immortalis). A pesar de esto, en comparación conmigo mismo, la mejora del rendimiento en comparación con el producto de la generación anterior sigue siendo considerable.

Por supuesto, como chip desarrollado por DeepMind, Tensor G4 tiene una buena potencia informática de IA. Google reveló que tiene una velocidad de salida "líder en la industria" de 45 tokens por segundo.

Para garantizar que la experiencia de IA en el dispositivo se desarrolle sin problemas, Google también ha actualizado la memoria de la serie Pixel 9, que viene con 12 GB de RAM, y Pixel 9 Pro y Pixel 9 Pro XL vienen con 16 GB de RAM.

La serie Pixel siempre ha sido la referencia de las aplicaciones tecnológicas de Google. Los nuevos teléfonos están equipados con Gemini Live y saldrán a la venta en agosto. Google dijo que los usuarios de Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold pueden disfrutar de una suscripción Gemini Advanced de un año después de comprar el teléfono. Parece que en comparación con la serie iPhone 16 equipada con modelos grandes OpenAI, Google ha dado un paso adelante esta vez.

Google introdujo una serie de capacidades de IA generativa para Pixel.

Entre ellos, Pixel Studio puede ayudarte a transformar ideas en imágenes en tu teléfono. Se compone de un modelo de difusión del lado del dispositivo que se ejecuta en Tensor G4 y un modelo de texto a imagen de Imagen 3 en la nube.



El nuevo modelo de imagen de Google, Imagen 3, se lanzó por primera vez en la conferencia I/O en mayo. El modelo se ha optimizado y actualizado en términos de generación de detalles, iluminación, interferencias, etc., y se ha mejorado significativamente su capacidad para comprender indicaciones. En la conferencia de prensa de hoy, Google DeepMind presentó un artículo de Imagen 3 sobre arXiv:



  • Enlace del artículo: https://arxiv.org/abs/2408.07009

Pixel Screenshots te ayuda a guardar, organizar y recuperar información importante que deseas recordar para más adelante.

Digamos que tienes una amiga a la que le encantan las ardillas y pronto será su cumpleaños. Puedes buscar regalos y tomar capturas de pantalla de camisetas de ardilla, posavasos de ardilla y todo lo relacionado con ardilla en Google Chrome. Pixel Screenshots analizará el contenido de todas estas imágenes y te ayudará a buscar esta información en tu aplicación. Luego, simplemente abre la aplicación y busca "ardilla" y aparecerán esos resultados. También incluirá enlaces a todo lo que encuentres, así como un resumen e información relacionada sobre el contenido que estás viendo.



Una de las cosas más comunes que hace la gente en sus teléfonos es consultar el tiempo. Pixel Weather puede proporcionar información meteorológica más precisa y Gemini Nano también generará informes meteorológicos de IA personalizados para que las personas comprendan las condiciones meteorológicas del día.

En términos de tomar fotografías que requieren todos los teléfonos móviles, Pixel 9 agrega funciones de disparo con IA para mejorar la eficiencia de la producción cinematográfica.

A menudo, en las fotografías grupales falta un fotógrafo designado. Con Add Me, puedes tomar fotos con todos en la habitación sin tener que cargar un trípode o pedir ayuda a extraños.



Con el Panorama rediseñado, ahora puedes tomar fotografías detalladas incluso con poca luz. Este es el panorama con poca luz de mayor calidad disponible en cualquier teléfono inteligente.



Además, Magic Editor en Google Photos tiene nuevas funciones de edición que te permiten tomar la foto que quieras. La función de encuadre automático puede recomponer la foto y solo necesitas ingresar lo que quieres ver (por ejemplo: agregar flores silvestres en un espacio vacío). campo) Es decir, puedes recomponer fotos y convertir las ideas en realidad.

La grabación inteligente de llamadas de modelos grandes ahora también está integrada en el sistema Android. La función Clear Calling mejora aún más la calidad del audio y la nueva función Call Notes envía un resumen privado y una transcripción completa de la llamada tan pronto como el usuario cuelga. Así, cuando recibas una llamada, no tendrás que buscar papel y bolígrafo para tomar notas. Para proteger la privacidad, la grabación de llamadas se ejecuta completamente en el dispositivo.



Los últimos dispositivos Pixel 9 son los primeros teléfonos Android que cuentan con la nueva función SOS satelital, para que los usuarios puedan comunicarse con los servicios de emergencia y compartir su ubicación vía satélite incluso cuando no hay una red móvil. Satellite SOS estará disponible primero en dispositivos Pixel 9 en EE. UU., independientemente del plan de su operador. Esta función será gratuita durante los primeros dos años en Pixel.



Finalmente, los precios de Pixel 9, Pixel 9 Pro y Pixel 9 Pro XL están disponibles para pedidos por adelantado, desde $ 799, $ 999 y $ 1,099 respectivamente. Pixel 9 y Pixel 9 Pro XL estarán disponibles el 22 de agosto en Google Store y en los socios minoristas de Google. El Pixel 9 Pro estará disponible en Estados Unidos el 4 de septiembre, mientras que el Pixel 9 Pro Fold estará disponible en otros mercados en las próximas semanas.

Contenido de referencia:

https://blog.google/products/pixel/google-pixel-9-pro-xl/

https://www.androidauthority.com/google-tensor-g4-explained-3466184/