¡Géminis está en el móvil! El Pixel 9 de Google cobra los futuros emitidos por Apple y OpenAI

2024-08-14

Autor｜Jessica
Correo electrónico | [email protected]

Esta mañana temprano, Google celebró la conferencia "Made by Google 2024" en su sede de Mountain View, Silicon Valley. Este evento anual, que se suponía que tendría lugar en octubre como de costumbre, se trasladó al verano para reunirse con el público con antelación y evitar el lanzamiento del nuevo iPhone por parte de Apple en septiembre.

Como se rumoreaba, en la conferencia se presentaron la nueva generación de teléfonos insignia de Android de Google, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y la versión de pantalla plegable Pixel 9 Pro Fold, junto con los auriculares inalámbricos Pixel Buds Pro 2 y los relojes Pixel Watch 3.

Pero además de los nuevos productos de hardware, la obsesión de Google y el mayor protagonista del juego sigue siendo la omnipresente IA.

En el video promocional oficial, se le pide a Gemini que escriba una "carta de ruptura" con el viejo teléfono móvil y se muestra el llamativo "Oh, hola, IA".

Hace dos meses, Apple anunció oficialmente Apple Intelligence, y la serie iPhone 16 se presenta como un dispositivo clave que estará completamente adaptado y ejecutará Apple AI. OpenAI es una bomba de humo todos los días, desde el "Proyecto Q" hasta la expresión "Fresa", que hace que la gente entre en pánico. Google sabe que no puede esperar más: ha lanzado el asistente Gemini recientemente actualizado y más de una docena de nuevas funciones de inteligencia artificial en Android, y están disponibles de inmediato, no en el futuro.

Rick Osterloh, que dirige el equipo de plataformas y dispositivos de Google, pareció apuñalar por la espalda a un oponente al comienzo de su discurso:

“Hay tantas promesas sobre la IA y tantos eslóganes de 'próximamente'. Hoy estamos mostrando un progreso real y verán un montón de demostraciones en vivo de nuevos productos Pixel, funciones de Android y experiencias de IA y Gemini. En el fondo de todo esto, estamos plenamente en la era Géminis".

Nueva actualización de Gemini: puede interactuar con más aplicaciones, Gemini Live te permite finalmente experimentar "Ella"

La IA del lado del dispositivo de Google está impulsada por su modelo multimodal liviano Gemini Nano, y se ha introducido el Gemini 1.5 Flash, más flexible. Actualmente admite 45 idiomas, cubre más de 200 países y regiones y puede funcionar en cientos de modelos de teléfonos móviles. Los usuarios pueden activarlo a través de imágenes, videos o comandos de voz para realizar tareas.

Ahora, el asistente inteligente Gemini se puede vincular con calendario, tareas, Google Keep, YouTube Music y más aplicaciones.

Por ejemplo, si ves un cartel del concierto de Sabrina Carpenter, puedes abrir Gemini, tomar una foto y preguntar: "¿Estaré libre cuando ella venga a San Francisco este año?". Géminis extraerá información relevante de la imagen, se conectará al calendario y dará una respuesta.

Hay un episodio interesante aquí. El personal falló dos veces seguidas al mostrar este ejemplo y Gemini respondió con éxito después de hacer la pregunta por tercera vez. Pero esto simplemente demuestra que todo es una verdadera prueba sobre el terreno y no una trampa. Después de que Gemini finalmente respondió con una concentración sin aliento, el público estalló en aplausos. El hermano pequeño también dio un suspiro de alivio y dijo: "Gracias al Dios del demos".

Géminis también puede entender lo que se muestra en la pantalla. Cuando esté babeando por un vlog de una tienda de alimentos, puede indicarle directamente a Gemini que "cree una lista de alimentos consumidos por el blogger en el video", y se conectará al video de YouTube y obtendrá la información requerida de los subtítulos. Síguelo también la próxima vez. Registrado tal como está.

Hay muchos ejemplos de esto, como configurar recordatorios regulares para sincronizar con "Tareas", crear listas de reproducción de música, redactar correos electrónicos personalizados y enviarlos usando Gmail, etc. A medida que Gemini coordina el trabajo entre más aplicaciones diarias, la producción y la eficiencia de la vida de los usuarios se han mejorado aún más.

Lo que hace que estas experiencias sean más fluidas e inteligentes es Gemini Live, una nueva función de voz lanzada oficialmente por Google.

Como reproductor de voz GPT-4o frontal, Gemini Live permite a los usuarios tener la interacción más natural en tiempo real con Gemini. Desde acompañar entrevistas simuladas, practicar el habla, realizar una lluvia de ideas hasta cualquier necesidad de comunicación, Gemini Live puede brindar una experiencia de chat de la vida real. Puedes pausar, interrumpir o cambiar de tema en cualquier momento durante la conversación, y puedes elegir entre 10 voces de diferentes géneros y personalidades según tus preferencias.

Lo que es aún más emocionante es que esta vez Google tiene mucho más éxito que OpenAI.

Justo cuando GPT-4o todavía estaba oculto y sólo permitía a un pequeño grupo de usuarios probar la versión beta, Google anunció generosamente: A partir de hoy, el acceso a la versión en inglés de Android de Gemini Live estará abierto a todos los usuarios de pago, y será ampliado en las próximas semanas a iOS y más idiomas.

¡No lo digas, no lo digas!

Más de 10 actualizaciones de IA: resumen automático de llamadas, búsqueda de capturas de pantalla, edición de imágenes, traducción en tiempo real...

Con el modelo Gemini como núcleo, Google también ha actualizado una gran cantidad de funciones de IA únicas y prácticas para dispositivos Pixel.

1. Nueva versión de la aplicación meteorológica: utilice tecnología de inteligencia artificial para mejorar la precisión de los pronósticos meteorológicos. Puede predecir con precisión la hora de inicio y finalización de la lluvia y generar informes meteorológicos personalizados, eliminando la molestia de verificar cada dato uno por uno.

2. Notas de llamada: esta función "Notas de llamada" recientemente lanzada generará automáticamente un resumen privado y un registro detallado de la conversación una vez finalizada la llamada. Cuando necesite registrar información importante, como la hora y la dirección, pero no tenga lápiz ni papel a mano, simplemente abra Notas de llamada y todos los registros de texto se guardarán en el registro de llamadas. (Para proteger la privacidad, esta función se ejecuta completamente en el dispositivo local y ambas partes de la llamada serán notificadas cuando esté activada).

3. Capturas de pantalla de píxeles: Todo el mundo está acostumbrado a realizar capturas de pantalla en sus teléfonos móviles para guardar información, pero también resulta difícil volver atrás y buscar entre cientos o miles de capturas de pantalla cuando es necesario. Esta nueva aplicación facilita guardar, organizar y buscar capturas de pantalla de información. Supongamos que tiene una captura de pantalla del código de acceso al B&B en el que está a punto de registrarse, pero no puede recordarlo cuando llega. Abra Pixel Screenshots y simplemente pregunte, rápidamente lo ayudará a encontrar la captura de pantalla correspondiente y extraer la información de texto en la imagen.

4. Pixel Studio: una nueva aplicación de mapeo de IA, impulsada por el modelo de difusión local que se ejecuta en el chip Tensor G4 y el modelo de texto a imagen en la nube Imagen 3. Puede realizar funciones como generación creativa, ajuste de estilo y pegatinas personales a través de indicaciones en lenguaje natural.

Los teléfonos Pixel también han agregado dos nuevas y deslumbrantes funciones impulsadas por IA para fotografía y video:

1. Agrégame: ¡Esta función “Agregarme” es muy interesante! Como sugiere el nombre, puede incluirte en la foto. Dos empleados en el sitio de demostración invitaron a la estrella de la NBA Jimmy Butler, encendieron la cámara y la deslizaron al modo Agregarme. Primero, el personal A tomó una foto con Jimmy y luego, bajo la guía de una superposición de realidad aumentada, fue la del personal B. girarse para tomar la foto. El resultado es una fotografía clara y de cuerpo completo de los tres sin necesidad de un fotógrafo adicional.

2. Magic Editor: utilizando tecnología de inteligencia artificial generativa, los usuarios pueden reinventar y editar fotos en Magic Editor. Por ejemplo, expanda el marco, mueva objetos, cambie el fondo o incluso rodee un área pequeña y solicite "agregar un globo aerostático".

Además de una característica muy linda Made You Look: todos los padres saben lo difícil que es posar para fotos con muñecos pequeños, por lo que la máquina plegable Pixel 9 tiene una nueva opción "Make You Laugh" que les permite reproducir interesantes clips de animación en el exterior. Pantalla, atrae la atención de los niños.

Siguiendo centrándose en la lente de la cámara, Google ha realizado cuatro mejoras de IA para personas y escenarios con necesidades especiales:

1. Marco guiado: Diseñado específicamente para personas con discapacidad visual o baja visión, ayuda a los usuarios a tomar excelentes fotografías y selfies mediante guía de voz. La última actualización mejora el reconocimiento de objetos, el filtrado facial inteligente en fotografías grupales y las capacidades de enfoque en escenas complejas, y se puede habilitar directamente desde la configuración de la cámara.

2. Lupa: esta es una aplicación exclusiva para teléfonos Pixel que utiliza inteligencia artificial para ayudar a los usuarios con baja visión a magnificar el mundo que los rodea. Las nuevas características incluyen buscar palabras específicas en el entorno, usar el modo de imagen en imagen para ver los detalles de la escena, seleccionar la mejor lente para hacer zoom y permitir que la iluminación para selfies se use como espejo.

Utilice la lupa para identificar menús y señales de información del aeropuerto

3. Modo de pantalla dual de transcripción en tiempo real: el modo de pantalla dual lanzado especialmente para teléfonos móviles plegables permite a los usuarios colocar el teléfono móvil en una postura de escritorio, lo que permite que varias personas vean la transcripción de conversaciones en tiempo real al mismo tiempo. Esto es muy útil para conversaciones en reuniones o cenas.

4. Traducción de subtítulos en tiempo real: soporte en varios idiomas, se han agregado siete traducciones de nuevos idiomas, incluidos coreano y chino, lo que amplía la disponibilidad de subtítulos en tiempo real y transcripción en tiempo real, que se pueden usar incluso sin conexión a Internet.

Además, se han agregado nuevas funciones al reloj inteligente Pixel para detectar automáticamente el sueño y habilitar el modo de suspensión, ayudar a los usuarios a planificar carreras, reflejar el progreso de la carrera y brindar sugerencias de carrera diarias. También fue pionero en la detección de pulso por IA, combinando sensores Pixel Watch 3, IA y algoritmos de procesamiento de señales para detectar eventos de desaparición del pulso causados por paro cardíaco, insuficiencia respiratoria, sobredosis de drogas, etc.

Finalmente, Google también reveló varios proyectos que están en progreso y que se lanzarán en un futuro próximo:

Uno es el Proyecto Astra, que se presentó anteriormente en la conferencia I/O y utiliza cámaras para mostrar el entorno circundante e interactuar con Gemini. Su aplicación práctica se implementará primero en Gemini Live, convirtiéndose en un asistente de IA integral más parecido a un agente.

El otro es Gemini Research. Esta función está diseñada para ayudar a las personas a realizar razonamiento, planificación y memoria más avanzados mediante la creación de planes de investigación de varios pasos, la integración de información compleja de Internet y la generación automática de informes de investigación bien estructurados. Se espera que se implemente para usuarios avanzados dentro de unos meses, lo que mejorará en gran medida la eficiencia de la investigación y ahorrará tiempo y energía.

Cuatro teléfonos Pixel 9, auriculares Buds Pro 2, relojes inteligentes, Google reúne hardware de IA para toda la familia

Todas las funciones de IA mencionadas anteriormente, incluido el asistente Gemini actualizado y varias aplicaciones de IA nuevas, se integrarán en los nuevos productos de hardware de IA lanzados por Google para satisfacer a los consumidores.

La gama completa de características y precios se resume a continuación:

Teléfonos móviles de la serie Pixel 9

Google ha lanzado cuatro teléfonos de la serie Pixel 9: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold. Ambos están equipados con el último chip Google Tensor G4, que admite varias mejoras de rendimiento de IA.

Crédito de la foto: Sam Rutherford/Engadget.

• Pixel 9: pantalla Actua de 6,3 pulgadas, 12 GB de RAM, cámara principal de 50 MP y cámara ultra ancha de 48 MP en la parte trasera, cámara frontal de 10,5 MP. A partir de $799, está disponible en cuatro colores: negro obsidiana, blanco porcelana, verde acebo y rosa peonía.

• Pixel 9 Pro: pantalla Super Actua de 6,3 pulgadas, 16 GB de memoria, cámara frontal de 42 MP, tres cámaras traseras (cámara principal de 50 MP, ultra gran angular de 48 MP y teleobjetivo de 48 MP). Los precios comienzan en $999 y están disponibles en negro obsidiana, blanco porcelana, avellana y rosa.

• Pixel 9 Pro XL: Equipado con una pantalla Super Actua de 6,8 pulgadas, desde $1,099, con la misma memoria, configuración de diseño y opciones de color que el Pro.

• Pixel 9 Pro Fold: un teléfono plegable con la pantalla más grande jamás vista en un teléfono de Google y el teléfono plegable más delgado. 16 GB de memoria, similar a la configuración de la cámara Pixel Fold del año pasado. El precio comienza en $1,799.

Los cuatro teléfonos ofrecen hasta siete años de actualizaciones de seguridad y del sistema operativo, lo que mejora la durabilidad y la experiencia del usuario.

Auriculares inalámbricos Pixel Buds Pro 2

Google ha lanzado una nueva generación de auriculares inalámbricos con calidad de sonido y conectividad mejoradas. Los usuarios que lleven Pixel Buds Pro 2 podrán hablar con Gemini sin un teléfono móvil.

Reloj inteligente Pixel Watch 3

Disponible en dos tamaños (41 mm y 45 mm), la pantalla es más grande e integra más funciones del ecosistema de Google, como la transmisión de video de la cámara Nest y el timbre, la funcionalidad de control remoto de Google TV, Google Maps sin conexión, etc. El reloj también ofrece sugerencias de ejercicio basadas en IA y tiene una duración de batería de hasta 24 horas, que se puede ampliar a 36 horas activando el modo de ahorro de energía.

En general, la publicación de Google es bastante sincera.

Hace unos días, el Twitter oficial respondió a las expectativas de los internautas: "¡Simplemente ya no queremos ocultarlo!".

Hoy no solo presentamos nuevos productos de hardware de la serie Pixel 9, sino que, lo que es más importante, demostramos la aplicación práctica de nuestra propia tecnología de IA generativa. Desde el asistente más inteligente Gemini hasta varias funciones de IA que mejoran la comodidad diaria, Google obviamente quiere abofetear a algunos "jugadores del futuro" con acciones: la IA no debería ser sólo un eslogan, sino que debería penetrar en todos los aspectos de la vida y permitir realmente a los usuarios para usarlo en su vida diaria. Disfrute de una experiencia más eficiente e inteligente.

Presentarlo antes de la conferencia de otoño de Apple no solo puede generar más ciclos de noticias para sí mismo, sino también brindar más ventanas de tiempo para las mejoras del Asistente Gemini. Su rendimiento en el futuro depende de los comentarios de los usuarios después de su lanzamiento al mercado.

Con la reciente fuga de cerebros y la reputación en declive de OpenAI, Google puede realmente estar listo para fortalecer su presencia en el mercado de Android en todos los ámbitos y librar una batalla frontal con Apple.

noticias

¡Géminis está en el móvil! El Pixel 9 de Google cobra los futuros emitidos por Apple y OpenAI

Introducción

Mi información de contacto