2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Auteur|Jessica
Courriel | [email protected]
Tôt ce matin, Google a organisé la conférence « Made by Google 2024 » à son siège social à Mountain View, dans la Silicon Valley. Cet événement annuel, qui devait avoir lieu comme d'habitude en octobre, aurait été déplacé à l'été pour rencontrer le public en amont afin d'éviter le lancement par Apple du nouvel iPhone en septembre.
Comme le dit la rumeur, la nouvelle génération de téléphones phares Android de Google Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL et la version à écran pliable Pixel 9 Pro Fold ont tous été dévoilés lors de la conférence, ainsi que les écouteurs sans fil Pixel Buds Pro 2 et les montres Pixel Watch 3.
Mais en plus des nouveaux produits matériels, l’obsession de Google et le plus grand protagoniste du jeu reste l’IA omniprésente.
Dans la vidéo promotionnelle officielle, Gemini est invité à écrire une « lettre de rupture » avec l'ancien téléphone portable, et le « Oh Hi, AI » accrocheur s'affiche.
Il y a deux mois, Apple a officiellement annoncé Apple Intelligence, et la série iPhone 16 se présente comme un appareil clé qui sera entièrement adapté et exécutera Apple AI. OpenAI est une bombe fumigène au quotidien, du « Q Project » à l'expression « Strawberry », qui fait paniquer les gens. Google sait qu'il ne peut plus attendre : il a lancé l'assistant Gemini récemment mis à jour et plus d'une douzaine de nouvelles fonctions d'IA sur Android, et elles sont disponibles immédiatement, et non dans le futur.
Rick Osterloh, qui dirige l'équipe plate-forme et appareils de Google, a semblé poignarder un adversaire au début de son discours :
« Il y a tellement de promesses concernant l’IA, et tellement de slogans « à venir ». Aujourd’hui, nous montrons de réels progrès, et vous verrez une tonne de démonstrations en direct des nouveaux produits Pixel, des fonctionnalités Android, des expériences d’IA et Gemini. Au cœur de tout cela, nous sommes pleinement dans l’ère des Gémeaux. »
1
La nouvelle mise à jour de Gemini : peut interagir avec plus d'applications, Gemini Live vous permet enfin de découvrir « Elle »
L'IA côté appareil de Google est pilotée par son modèle multimodal léger Gemini Nano, et le Gemini 1.5 Flash, plus flexible, a été introduit. Prend actuellement en charge 45 langues, couvre plus de 200 pays et régions et peut fonctionner sur des centaines de modèles de téléphones mobiles. Les utilisateurs peuvent le déclencher via des images, des vidéos ou des commandes vocales pour effectuer des tâches.
Désormais, l'assistant intelligent Gemini peut être lié au calendrier, aux tâches, à Google Keep, à YouTube Music et à d'autres applications.
Par exemple, si vous voyez une affiche de concert de Sabrina Carpenter, vous pouvez ouvrir Gemini, prendre une photo et demander : « Suis-je libre quand elle viendra à San Francisco cette année ? Gemini extraira les informations pertinentes de l’image, se connectera au calendrier et fournira une réponse.
Il y a un épisode intéressant ici. Le personnel a échoué deux fois de suite en montrant cet exemple, et Gemini a répondu avec succès après avoir posé la question pour la troisième fois. Mais cela prouve simplement que tout est un véritable test sur place et non une triche. Après que Gemini ait finalement répondu avec une concentration haletante, le public a éclaté d'applaudissements. Le petit frère poussa également un soupir de soulagement et dit : « Merci au Dieu des démos.
Les Gémeaux peuvent également comprendre ce qui est affiché à l’écran. Lorsque vous bavez sur un vlog de magasin d'alimentation, vous pouvez directement demander à Gemini de "créer une liste des aliments consommés par le blogueur dans la vidéo", et il se connectera à la vidéo YouTube et récupérera les informations requises dans les sous-titres. suivez-le également la prochaine fois. Enregistré tel quel.
Il existe de nombreux exemples, comme la configuration de rappels réguliers à synchroniser avec les « Tâches », la création de playlists musicales, la rédaction d'e-mails personnalisés et leur envoi via Gmail, etc. À mesure que Gemini coordonne le travail entre davantage d'applications quotidiennes, la production et l'efficacité de la vie des utilisateurs ont été encore améliorées.
Ce qui rend ces expériences plus fluides et plus intelligentes, c'est Gemini Live, une nouvelle fonctionnalité vocale officiellement lancée par Google.
En tant que lecteur vocal GPT-4o frontal, Gemini Live permet aux utilisateurs d'avoir l'interaction en temps réel la plus naturelle avec Gemini. Qu'il s'agisse d'accompagnement d'entretiens simulés, de pratique de prise de parole, de brainstorming ou de tout besoin de communication, Gemini Live peut offrir une expérience de chat réelle. Vous pouvez mettre en pause, interrompre ou changer de sujet à tout moment pendant la conversation, et vous pouvez choisir parmi 10 voix de genres et de personnalités différents selon vos préférences.
Ce qui est encore plus excitant, c’est que cette fois, Google a beaucoup plus de succès qu’OpenAI.
Juste au moment où GPT-4o était encore caché et ne permettait qu'à un petit groupe d'utilisateurs d'essayer la version bêta, Google a généreusement annoncé : à partir d'aujourd'hui, l'accès à la version anglaise Android de Gemini Live sera ouvert à tous les utilisateurs payants, et sera étendu dans les prochaines semaines à iOS et à d’autres langues.
Ne le dis pas, ne le dis pas !
1
Plus de 10 mises à jour de l'IA : résumé automatique des appels, recherche de capture d'écran, édition d'images, traduction en temps réel...
Avec le modèle Gemini comme noyau, Google a également mis à jour un grand nombre de fonctions d'IA uniques et pratiques pour les appareils Pixel.
1. Nouvelle version de l'application météo : utilisez la technologie de l'intelligence artificielle pour améliorer la précision des prévisions météorologiques. Il peut prédire avec précision l'heure de début et de fin des précipitations et générer des rapports météorologiques personnalisés, éliminant ainsi le problème de vérifier chaque donnée une par une.
2. Notes d'appel : cette nouvelle fonctionnalité "Notes d'appel" générera automatiquement un résumé privé et un enregistrement détaillé de la conversation une fois l'appel terminé. Lorsque vous avez besoin d'enregistrer des informations importantes telles que l'heure et l'adresse mais que vous n'avez ni stylo ni papier à portée de main, ouvrez simplement Call Notes et tous les enregistrements de texte seront enregistrés dans le journal des appels. (Pour protéger la confidentialité, cette fonctionnalité s'exécute entièrement sur l'appareil local et les deux parties à l'appel seront averties lorsqu'elle sera activée.)
3. Captures d'écran en pixels : tout le monde est habitué à prendre des captures d'écran sur son téléphone mobile pour enregistrer des informations, mais il est également difficile de revenir en arrière et de rechercher parmi des centaines ou des milliers de captures d'écran en cas de besoin. Cette nouvelle application facilite la sauvegarde, l'organisation et la recherche de captures d'écran d'informations. Supposons que vous ayez une capture d'écran du code d'accès du B&B dans lequel vous êtes sur le point de vous enregistrer, mais que vous ne vous en souveniez pas à votre arrivée. Ouvrez Pixel Screenshots et demandez simplement, cela vous aidera rapidement à trouver la capture d'écran correspondante et à extraire les informations textuelles dans l'image.
4. Pixel Studio : une nouvelle application de cartographie IA, pilotée par le modèle de diffusion locale fonctionnant sur la puce Tensor G4 et le modèle texte-image cloud Imagen 3. Il peut exécuter des fonctions telles que la génération créative, l'ajustement du style et les autocollants personnels via des invites en langage naturel.
Les téléphones Pixel ont également ajouté deux nouvelles fonctionnalités éblouissantes basées sur l'IA pour la photographie et la vidéo :
1. Ajoutez-moi : Cette fonction « Ajoutez-moi » est très intéressante ! Comme son nom l’indique, il peut vous inclure sur la photo. Deux membres du personnel du site de démonstration ont invité la star de la NBA Jimmy Butler, ont allumé l'appareil photo et l'ont fait glisser en mode Ajouter moi. Tout d'abord, le personnel A a pris une photo avec Jimmy, puis sous la direction de la superposition de réalité augmentée, c'était celle du personnel B. tournez-vous pour prendre la photo. Le résultat est une photo claire et complète d’eux trois sans avoir besoin d’un photographe supplémentaire.
2. Magic Editor : Grâce à la technologie d'IA générative, les utilisateurs peuvent réimaginer et modifier des photos dans Magic Editor. Par exemple, agrandissez le cadre, déplacez des objets, modifiez l'arrière-plan ou même entourez une petite zone et demandez « d'ajouter une montgolfière ».
Plus une fonction Made You Look très mignonne : les parents savent tous à quel point il est difficile de poser pour des photos avec de petites poupées, c'est pourquoi la plieuse Pixel 9 dispose d'une nouvelle option « Make You Laugh » qui leur permet de lire des clips d'animation intéressants sur l'extérieur. Écran., attirez l'attention des enfants.
En continuant à se concentrer sur l'objectif de la caméra, Google a apporté quatre améliorations à l'IA pour les personnes et les scénarios ayant des besoins particuliers :
1. Cadre guidé : conçu spécifiquement pour les personnes malvoyantes ou malvoyantes, il aide les utilisateurs à prendre d'excellentes photos et selfies grâce au guidage vocal. La dernière mise à jour améliore la reconnaissance des objets, le filtrage intelligent du visage dans les photos de groupe et les capacités de mise au point dans les scènes complexes, et peut être activée directement à partir des paramètres de l'appareil photo.
2. Loupe : il s'agit d'une application exclusive pour les téléphones Pixel qui utilise l'IA pour aider les utilisateurs malvoyants à magnifier le monde qui les entoure. Les nouvelles fonctionnalités incluent la recherche de mots spécifiques dans l'environnement, l'utilisation du mode image dans l'image pour voir les détails de la scène, la sélection du meilleur objectif sur lequel zoomer et la possibilité d'utiliser l'éclairage selfie comme miroir.
Utilisez la loupe pour identifier les menus et les panneaux d'information de l'aéroport
3. Mode double écran de transcription en temps réel : le mode double écran spécialement lancé pour les téléphones mobiles pliables permet aux utilisateurs de placer le téléphone mobile dans une posture de bureau, permettant à plusieurs personnes de visualiser la transcription en temps réel des conversations en même temps. Ceci est très utile pour les conversations lors de réunions ou pendant un dîner.
4. Traduction des sous-titres en temps réel : prise en charge multilingue, sept nouvelles traductions, dont le coréen et le chinois, ont été ajoutées, élargissant ainsi la disponibilité des sous-titres et de la transcription en temps réel, qui peuvent être utilisés même sans connexion Internet.
De plus, de nouvelles fonctions ont été ajoutées à la montre intelligente Pixel pour détecter automatiquement le sommeil et activer le mode veille, aider les utilisateurs à planifier leurs courses, refléter la progression de leur course et fournir des suggestions de course quotidiennes. Il a également été pionnier dans la détection du pouls par l'IA, combinant les capteurs de la Pixel Watch 3, l'IA et les algorithmes de traitement du signal pour détecter les événements de disparition du pouls provoqués par un arrêt cardiaque, une insuffisance respiratoire, une surdose médicamenteuse, etc.
Enfin, Google a également dévoilé plusieurs projets en cours et qui seront dévoilés prochainement :
L'un d'entre eux est le projet Astra, qui a déjà été présenté lors de la conférence I/O et utilise des caméras pour afficher l'environnement environnant et interagir avec Gemini. Son application pratique sera d'abord implémentée dans Gemini Live, devenant un assistant IA complet de type agent.
L’autre est Gemini Research. Cette fonctionnalité est conçue pour aider les utilisateurs à effectuer un raisonnement, une planification et une mémoire plus avancés en créant des plans de recherche en plusieurs étapes, en intégrant des informations complexes provenant d'Internet et en générant automatiquement des rapports de recherche bien structurés. Il devrait être déployé auprès des utilisateurs avancés d’ici quelques mois, ce qui améliorera considérablement l’efficacité de la recherche et permettra d’économiser du temps et de l’énergie.
1
Quatre téléphones Pixel 9, écouteurs Buds Pro 2, montres intelligentes, Google rassemble du matériel IA pour toute la famille
Toutes les fonctions d'IA ci-dessus, y compris l'assistant Gemini mis à niveau et diverses nouvelles applications d'IA, seront intégrées dans les nouveaux produits matériels d'IA lancés par Google pour répondre aux consommateurs.
La gamme complète des fonctionnalités et des prix est résumée ci-dessous :
Téléphones mobiles de la série Pixel 9
Google a lancé quatre téléphones de la série Pixel 9 : Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL et Pixel 9 Pro Fold. Les deux sont équipés de la dernière puce Google Tensor G4, prenant en charge diverses améliorations des performances de l'IA.
Crédit photo : Sam Rutherford/Engadget
• Pixel 9 : écran Actua de 6,3 pouces, 12 Go de RAM, caméra principale de 50 MP et ultra-large de 48 MP à l'arrière, caméra frontale de 10,5 MP. À partir de 799 $, il est disponible en quatre couleurs : noir obsidienne, blanc porcelaine, vert houx et rose pivoine.
• Pixel 9 Pro : écran Super Actua de 6,3 pouces, 16 Go de mémoire, caméra frontale de 42 MP, trois caméras arrière (caméra principale de 50MP, ultra grand angle de 48MP et téléobjectif de 48MP). Les prix commencent à 999 $ et sont disponibles en noir obsidienne, blanc porcelaine, noisette et rose.
• Pixel 9 Pro XL : équipé d'un écran Super Actua de 6,8 pouces, à partir de 1 099 $, avec la même mémoire, la même configuration de conception et les mêmes options de couleur que le Pro.
• Pixel 9 Pro Fold : un téléphone pliable doté du plus grand écran jamais vu sur un téléphone de Google et du téléphone pliable le plus fin. 16 Go de mémoire, similaire à la configuration de la caméra Pixel Fold de l’année dernière. Le prix commence à 1 799 $.
Les quatre téléphones offrent jusqu'à sept ans de mises à jour du système d'exploitation et de sécurité, améliorant ainsi la durabilité et l'expérience utilisateur.
Écouteurs sans fil Pixel Buds Pro 2
Google a lancé une nouvelle génération d'écouteurs sans fil offrant une qualité sonore et une connectivité améliorées. Les utilisateurs portant des Pixel Buds Pro 2 peuvent parler à Gemini sans téléphone portable.
Montre intelligente Pixel Watch 3
Disponible en deux tailles (41 mm et 45 mm), l'écran est plus grand et intègre davantage de fonctionnalités de l'écosystème Google, telles que le streaming vidéo de la caméra et de la sonnette Nest, la fonctionnalité de télécommande Google TV, Google Maps hors ligne, etc. La montre fournit également des suggestions d'exercices basées sur l'IA et a une autonomie de batterie allant jusqu'à 24 heures, qui peut être étendue à 36 heures en activant le mode d'économie d'énergie.
Dans l’ensemble, la sortie de Google est plutôt sincère.
Il y a quelques jours déjà, le Twitter officiel déclarait en réponse aux attentes des internautes : "Nous ne voulons plus le cacher !"
Aujourd’hui, nous proposons non seulement de nouveaux produits matériels de la série Pixel 9, mais, plus important encore, nous démontrons l’application pratique de notre propre technologie d’IA générative. De l'assistant Gemini plus intelligent aux diverses fonctions d'IA qui améliorent le confort au quotidien, Google veut évidemment gifler certains "acteurs du futur" par l'action : l'IA ne doit pas être qu'un slogan, mais doit pénétrer dans tous les aspects de la vie et permettre réellement aux utilisateurs pour l'utiliser dans leur vie quotidienne. Profitez d'une expérience plus efficace et plus intelligente.
Le dévoiler avant la conférence d’automne d’Apple peut non seulement gagner plus de cycles d’actualités, mais également fournir plus de fenêtres temporelles pour les améliorations de Gemini Assistant. Ses performances futures dépendent des commentaires des utilisateurs après son lancement sur le marché.
Avec la récente fuite des cerveaux d’OpenAI et sa réputation en déclin, Google pourrait vraiment être prêt à renforcer sa présence sur le marché Android à tous les niveaux et à mener une bataille frontale avec Apple.