2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Auteur |
modifier Jingyu |
Avec un mois d'avance sur Apple, Google a démontré toutes les possibilités des téléphones AI+ dans son nouveau téléphone Pixel.
Le 13 août, heure locale, Google a lancé de nouveaux produits matériels tels que Pixel 9, Pixel 9 Pro, l'écran pliable de deuxième génération Pixel 9 Fold, des montres intelligentes et des écouteurs. Par rapport au matériel, les gens sont plus préoccupés par la façon dont Google, en tant que gestionnaire du système Android, utilisera l'IA intégrée aux téléphones Android alors que les téléphones mobiles AI+ sont si populaires.
Il y a près de 10 mois, Google a lancé la première génération de téléphones mobiles IA. Il y a moins d'un an, le géant a de nouveau mis à jour son portefeuille de produits Gemini, Android et Pixel. Cette fois, l'accent est mis sur "J'ai ce que mes concurrents". avoir." "modèle.
Depuis qu'OpenAI a lancé le mode vocal ChatGPT et que les fonctions d'IA de l'iPhone de nouvelle génération d'Apple ont été exposées, Google n'est pas disposé à prendre du retard dans ce que ses pairs peuvent faire, y compris les conversations vocales d'IA, la recherche d'informations dans des captures d'écran, etc. Dans le même temps, Google intègre davantage l’IA dans son propre écosystème d’applications.
Qui est le leader des téléphones mobiles IA ? Google doit rivaliser avec Apple.
En réponse à OpenAI,
Gemini Live est en ligne
Gemini est la pierre angulaire des différents produits d'IA de Google et l'assistant par défaut des téléphones mobiles de la série Pixel 9 de Google. Les mises à niveau dont dispose Gemini lorsqu'il est intégré aux téléphones mobiles ont été un sujet majeur de la conférence.
Les Gémeaux sur les téléphones Google Pixel peuvent être invoqués en appuyant sur le bouton d'alimentation. À partir d'aujourd'hui, les utilisateurs peuvent afficher les superpositions Gemini au-dessus des applications qu'ils utilisent pour poser des questions sur ce qui est à l'écran, selon les dirigeants de Google. Par exemple, les utilisateurs peuvent poser des questions sur une vidéo YouTube qu'ils regardent, ou générer des images directement à partir des superpositions de Gemini et les glisser-déposer dans des applications telles que Gmail et Google Messages.
Google prévoit également de connecter Gemini à davantage d'applications « dans les semaines à venir », notamment Calendar, Keep et YouTube Music. Les fonctionnalités spécifiques incluent le fait de demander à Gemini de « créer une liste de lecture de chansons qui me rappellent la fin des années 90 ». « Prendre une photo d'un dépliant de concert et demander à Gemini de vérifier la disponibilité ce jour-là, et même de définir des rappels pour acheter des billets. » recherchez une recette dans votre compte Gmail et demandez-lui d'ajouter les ingrédients à votre liste de courses dans Keep."
Gemini utilise des captures d'écran pour extraire des informations et interagir avec plus d'applications Source de l'image : Google
En plus de ces expériences intégrées, Google a également officiellement lancé Gemini Live. Cette fonctionnalité peut être considérée comme la réponse de Google au mode vocal avancé GPT-4o lancé par OpenAI. Cette fonctionnalité a déjà été exposée lors de la conférence des développeurs I/O 2024 de Google et sera officiellement lancée aujourd'hui.
Les utilisateurs peuvent utiliser leur téléphone mobile pour mener des conversations vocales avec Gemini, le chatbot génératif d'IA de Google. Ils peuvent interrompre la conversation à mi-chemin et poser des questions de suivi, et la conversation peut être interrompue et reprise à tout moment. Quelques exemples d'utilisations spécifiques incluent le fait de laisser Gemini Live vous accompagner pour préparer des entretiens d'embauche, pratiquer des discours et discuter avec désinvolture de sujets qui vous intéressent.
Gemini Live vise évidemment à comparer l'interaction vocale de GPT-4o|Source de l'image : Google
Alors, Gemini Live présente-t-il des avantages par rapport au mode vocal de ChatGPT ?
On dit que l'architecture de modèle d'IA générative qui prend en charge Live - Gemini 1.5 Pro et Gemini 1.5 Flash a une « fenêtre contextuelle » plus longue que la moyenne, ce qui signifie qu'elle peut traiter et raisonner sur de grandes quantités de données avant de générer une réponse. En théorie, les conversations peuvent durer des heures.
Gemini Live fonctionne également en mains libres, permettant aux utilisateurs de poursuivre les conversations vocales en arrière-plan de l'application ou lorsque le téléphone est verrouillé, avec 10 nouvelles voix parmi lesquelles choisir.
Cependant, il convient de noter que Gemini Live n'a pas encore lancé la fonction « entrée multimodale », qui devrait être lancée « plus tard cette année ».
Il y a quelques mois, Google a publié une vidéo préenregistrée montrant comment Gemini Live pouvait reconnaître l'environnement de l'utilisateur grâce à des photos et des vidéos capturées par l'appareil photo du téléphone et réagir, par exemple en montrant une pièce de vélo cassée ou en expliquant ce qui se passait sur un écran d'ordinateur. . La fonctionnalité d'un morceau de code dont aucun n'a été démontré en direct.
De plus, Gemini Live est disponible pour les abonnés Gemini Advanced sur les téléphones Android et n'est pas gratuit. Il n'est actuellement disponible qu'en anglais, mais Google indique qu'il s'étendra à davantage de langues « dans les semaines à venir » et à iOS via une application.
Démonstration de diffusion en direct des dirigeants de Google Gemini Live|Source de l'image : Google
L'expérience de Google Gemini et le directeur de Google Assistant ont déclaré : "Google en est aux premiers stades d'exploration de diverses façons dont les assistants basés sur l'IA peuvent être utiles - et tout comme les téléphones Pixel, Gemini s'améliorera de plus en plus."
De plus, en termes de problèmes de confidentialité, les dirigeants de l'écosystème Android de Google ont déclaré que Gemini prend en charge des centaines de modèles de téléphones mobiles de dizaines de fabricants d'appareils et que lors du traitement des données des utilisateurs, les données ne quitteront pas le téléphone.
"Gemini peut vous aider à créer un plan d'entraînement quotidien basé sur un e-mail de votre entraîneur personnel ou à rédiger un profil d'emploi à l'aide de votre CV dans Google Drive. Seul Gemini peut tout faire de cette manière sécurisée et tout-en-un sans avoir besoin de le faire. Les données sont transmises à un fournisseur d'IA tiers que vous ne connaissez peut-être pas ou auquel vous ne faites pas confiance", a déclaré Sameer Samat, président de l'écosystème Android de Google.
"Comme Android est le premier système d'exploitation mobile à disposer d'un grand modèle d'IA multimodal sur l'appareil - appelé Gemini Nano - vos données ne quittent jamais votre téléphone tout en gérant certains des cas d'utilisation les plus sensibles."
L'IA est davantage intégrée à Android
Le plus grand avantage de Google dans la promotion des téléphones IA réside sans aucun doute dans ses multiples outils d'application et dans l'écosystème Android, Google compte désormais des milliards d'utilisateurs Android, et il y a évidemment plus de place pour cela qu'une application de chatbot.
L’année dernière, en tant que premier smartphone centré sur l’IA, la série Pixel 8 de Google a apporté diverses fonctionnalités d’IA. Par exemple, les utilisateurs peuvent supprimer, déplacer ou modifier des éléments individuels d'une photo, déplacer des expressions entre les photos pour obtenir la meilleure photo composite, effectuer une recherche basée sur des captures d'écran ou une « partie encerclée » de l'écran, et bien plus encore.
Toutes ces fonctionnalités sont apparues pour la première fois sur la série Pixel 8 et se sont depuis répandues dans tout l'écosystème Android.
La fonction « recherche circulaire » de Google est apparue pour la première fois sur le téléphone Galaxy AI de Samsung. En tant que partenaire de l'écosystème Android de Google, les téléphones de Samsung ont également ajouté de nombreuses fonctionnalités d'IA similaires. L’assistant IA Gemini susmentionné apparaît également dans le Galaxy Z Fold6 de Samsung, le Motorola Razr+ et d’autres téléphones mobiles.
Dans le même temps, d'autres fabricants ont également annoncé qu'ils lanceraient leur propre IA pour téléphones mobiles. Celui qui a le plus attiré l'attention ces derniers mois est Apple. La même direction et le même concept sont d'intégrer son propre écosystème d'applications.
En près d'un an, on peut dire que les « téléphones mobiles IA » sont devenus la perspective centrale de la vision du marché des téléphones mobiles, et pas seulement des téléphones mobiles de Google. Comment utiliser l’IA pour faire briller les gens est un défi pour Google. À l’heure actuelle, comme lors du lancement du téléphone IA de première génération Pixel 8, la plupart des résultats de Google sont toujours divers gadgets dotés de fonctions IA.
Lors de l'événement Made By Google de cette année, les principales nouvelles fonctionnalités d'IA de Google incluent :
« Ajoutez-moi » permet même à la personne qui prend la photo de s'inclure dans la photo de groupe ;
"Pixel Studio", un générateur d'images IA très similaire à la prochaine application Image Playground d'Apple ;
« Pixel Screenshots », qui analyse la galerie d'un utilisateur à la recherche de captures d'écran et les transforme en une base de données facilement consultable ;
"Call Notes" peut enregistrer un résumé des informations dans l'historique des appels. Après avoir activé cette fonction, toutes les personnes participant à l'appel recevront une notification.
Parmi eux, si vous souhaitez mettre en œuvre la fonction « Ajoutez-moi », le photographe prend d'abord une photo sans lui-même, puis une autre personne devient photographe et prend une autre photo. Pixel fusionnera les deux photos pour garantir que tout le monde figure sur une seule photo. Il n'est donc pas nécessaire de demander à un inconnu de prendre la photo.
Fonction photo de groupe|Source de l'image : Google
L’un des principaux arguments de vente du positionnement de la série Pixel 9 par Google est également la caméra AI, qu’il appelle elle-même « la première caméra pilotée par l’IA au monde ». Les dirigeants de Google ont également affirmé que "Pixel a été le premier téléphone à utiliser Night Sight dans les photos et les vidéos, et c'est désormais également le premier téléphone à capturer de superbes paysages panoramiques et urbains dans des conditions de faible luminosité". Lors de la conférence de presse, les dirigeants de Google ont également comparé les photos prises. du Pixel 9 Pro XL à l'iPhone 15 Pro Max d'Apple.
Effet de photographie de nuit sur téléphone mobile Google vs téléphone portable Apple|Source : Google
Le Pixel 9 Pro Fold pliable à écran ultra grand dispose également d'une fonction « Made You Look » qui peut être utilisée pour attirer l'attention des utilisateurs et les faire sourire devant l'appareil photo. Lorsque vous utilisez cette fonction, dépliez le téléphone et une animation visuelle accrocheuse sera jouée sur un côté de l'écran externe, comme un poulet jaune vif ou d'autres animations amusantes.
Fonctionnalités d'écran qui attirent l'attention des utilisateurs|Source de l'image : Google
Après avoir pris une photo, il existe également des outils de retouche photo, et Magic Editor de Google Photos a lancé cette année de nouvelles fonctionnalités. Par exemple, la fonction « Auto Frame » est utilisée pour corriger l’angle des photos inclinées, tout en utilisant l’IA générative pour combler les espaces autour du sujet afin de créer un champ de vision plus large. Il existe également une fonction « Réimaginer ». Après avoir décrit l'effet souhaité dans la zone de texte, vous pouvez utiliser l'IA générative pour créer une image P, comme transformer l'herbe au sol en fleurs sauvages, ajouter une montgolfière à une certaine partie du champ. ciel, etc
De plus, Google a suivi les traces d'Apple et a lancé une fonctionnalité « Satellite SOS » à utiliser en cas d'urgence. Cette fonctionnalité permet aux utilisateurs de contacter les services d'urgence et de partager des informations de localisation lorsqu'il n'y a pas de service cellulaire. Selon les dirigeants de Google, la série Pixel 9 sera « les premiers téléphones Android à pouvoir utiliser le SOS par satellite ».
Fonction SOS satellite|Source de l'image : Google
D'un point de vue fonctionnel, la combinaison du Pixel 9+ Gemini ne devance pas beaucoup les fabricants nationaux actuels d'Android en termes d'IA. Mais il convient de noter que, contrairement à Apple, Google dispose de ses propres systèmes et terminaux, ainsi que de grands modèles et du cloud computing. C'est l'entreprise qui a véritablement bouclé une boucle fermée dans le « cloud soft, hard et core » entre tous. entreprises actuellement.
Une fois qu'il y aura une percée dans l'IA des terminaux, Google, qui est prêt à tout, aura beaucoup plus de chances de « rendre sa grandeur » que ses concurrents.
Peut-être que ce qui manque à Google, c'est simplement une plus grande ambition.
*Source de l'image d'en-tête : Google
Cet article est un article original de Geek Park Pour une réimpression, veuillez contacter Geek Jun sur WeChat geekparkGO.