nouvelles

Du jour au lendemain, la version Google du GPT-4o et les téléphones AI ont tous été lancés

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Rapport sur le cœur de la machine

Editeur : Zenan, Chen Chen

Gemini Live compare GPT-4o et le compartiment de la famille de téléphones mobiles Google AI est en ligne.

Avant que GPT-4o n'entre sur l'iPhone, Google Gemini a pris les devants et a complété la version mobile.

Tôt le matin de mercredi, alors que les gens attendaient avec impatience le "Strawberry Big Model" d'OpenAI, Google a officiellement lancé Gemini Live et une série de produits matériels Pixel lors de l'événement Made by Google.



Lors de l'événement d'aujourd'hui, Google a réalisé une démonstration 100 % en direct en toute confiance, malgré quelques problèmes mineurs.



J'ai essayé d'utiliser mon téléphone pour lire des images à deux reprises (mais j'ai utilisé un Samsung), mais les deux fois ont échoué.

Mais comme le dit Google, nous sommes entrés dans « l’ère des Gémeaux ».

Après la série Pixel 9, une série de fonctionnalités Gemini AI publiées aujourd’hui apparaîtront également sur divers téléphones Android équipés d’Android 15.

Gemini Live : comparez GPT-4o et connectez-vous immédiatement

Gemini Live est un produit lancé par Google pour le mode vocal avancé d'OpenAI. Cette fonctionnalité est presque identique à ChatGPT et était auparavant en phase de test alpha.



Gemini Live offre une expérience de conversation mobile qui permet aux utilisateurs d'avoir des conversations fluides avec Gemini et même d'interrompre ou de modifier le sujet comme un appel téléphonique ordinaire sans taper.

Google le décrit dans un blog : Vous pouvez parler à Gemini Live (via l'application Gemini) et choisir l'un des 10 nouveaux sons naturels auxquels répondre (OpenAI ne propose que 3 sons). Vous pouvez même parler à votre rythme ou interrompre une réponse au milieu et poser des questions supplémentaires, comme dans une conversation normale.



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e320 f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Gemini Live peut être réveillé directement. Vous pouvez continuer à parler avec Gemini lorsque l'application s'exécute en arrière-plan ou lorsque le téléphone est verrouillé, et la conversation peut être interrompue et reprise à tout moment.

Gemini Live sera également intégré à diverses fonctions d'applications Android (telles que Keep), améliorant ainsi la convivialité de Gemini.



À partir d'aujourd'hui, Google déploie cette fonctionnalité auprès des utilisateurs Gemini Advanced de téléphones Android en anglais uniquement, et l'étendra à iOS et à d'autres versions linguistiques dans les semaines à venir.



Cependant, lors de la démonstration en direct, Gemini Live a échoué à deux reprises lorsque le personnel sur place a demandé des informations sur l'affiche du concert, obligeant le présentateur à changer de téléphone pour fonctionner correctement. Bien qu'il y ait eu quelques ratés lors de la démo, elle a finalement été un succès et Gemini Live a fini par extraire les informations pertinentes des images et se connecter au calendrier, fournissant ainsi aux utilisateurs des résultats précis.



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650930230&idx=2&sn=822b96951da8ef70408c0c546c6c5ae5&chksm=84e43848b393b15e320 f663d6c311ccab54157b0885da6dee24ce8e5260beed4153dfb2a432a&token=2010422951&lang=zh_CN#rd

Il convient de noter que, selon le chef de produit Leland Rechis, Google n'autorise pas Gemini Live à imiter d'autres sons que ces 10 sons. Google a peut-être fait cela pour éviter d'enfreindre les lois sur le droit d'auteur. Auparavant, OpenAI avait été poursuivi par ce dernier pour avoir utilisé la voix de la veuve.

Dans l’ensemble, cette fonctionnalité semble être un excellent moyen d’approfondir un sujet plus naturellement qu’en utilisant une simple recherche Google. Google note que Gemini Live constitue un pas en avant pour le projet Astra, le modèle d'IA multimodal que la société a lancé lors de Google I/O. Actuellement, Gemini Live ne prend en charge que les conversations vocales et Google espère ajouter des fonctionnalités de compréhension vidéo en temps réel à l'avenir.

Bénédiction des puces, le matériel Google arrive

Parallèlement au lancement de Gemini Live, Google a également lancé une nouvelle génération d'appareils matériels intelligents avant Apple et Huawei.

Le matériel nouvellement publié ce matin comprend les Pixel 9, Pixel 9 Pro et Pixel 9 Pro XL, ainsi qu'un téléphone à écran pliable Pixel 9 Pro Fold. Ils sont tous alimentés par la nouvelle puce Google Tensor G4, qui peut apporter diverses capacités d'IA générative. .

Les téléphones Pixel 9 présentent un nouveau look qui place l'appareil photo au premier plan, améliorant ainsi le module d'appareil photo emblématique et améliorant sa prise en main. Google affirme que ces téléphones sont deux fois plus durables que le Pixel 8.



Cette fois, pour la première fois, les modèles Pixel Pro sont disponibles en deux tailles différentes : Pixel 9 Pro (6,3 pouces) et Pixel 9 Pro XL (6,8 pouces), tous deux équipés d'écrans Super Actua et de caméras frontales de 42 MP. Outre la taille de l’écran, la vitesse de chargement et la batterie, le Pixel 9 Pro et le Pixel 9 Pro XL partagent des spécifications et des fonctionnalités identiques.



Il convient de noter que le téléphone mobile Pixel 9 utilise la nouvelle puce personnalisée Tensor G4 de Google. Il s'agit d'une nouvelle génération de puces pour téléphones mobiles hautes performances conçues pour améliorer les cas d'utilisation quotidienne, tels que l'ouverture plus rapide des applications, la navigation sur le Web, etc.



Tensor G4 est conçu par Google DeepMind, fabriqué par Samsung et utilise l'architecture Arm. G4 est optimisé pour exécuter les modèles d’intelligence artificielle les plus avancés. Ce sera le premier processeur à exécuter le modèle multimodal Gemini Nano, permettant aux grands modèles de comprendre des tâches telles que le texte, les images et l'audio uniquement du côté du téléphone mobile.



D'après l'actualité actuelle, le Tensor G4 est le même que son prédécesseur, utilisant le même cœur que la technologie de la génération actuelle - ce qui signifie qu'il deviendra bientôt un chipset rétrograde en septembre. Le cœur GPU statique appelé Mali signifie également que le Ray Tracing ne l'est pas. pris en charge (la version prise en charge s'appelle Immortalis). Malgré cela, par rapport à moi-même, l'amélioration des performances par rapport au produit de la génération précédente reste considérable.

Bien entendu, en tant que puce développée par DeepMind, Tensor G4 dispose d'une bonne puissance de calcul IA. Google a révélé qu'il avait une vitesse de sortie « leader du secteur » de 45 jetons par seconde.

Pour garantir le bon fonctionnement de l'expérience IA sur l'appareil, Google a également mis à niveau la mémoire de la série Pixel 9, livrée avec 12 Go de RAM, et les Pixel 9 Pro et Pixel 9 Pro XL sont livrés avec 16 Go de RAM.

La série Pixel a toujours été la référence en matière d'applications technologiques de Google. Les nouveaux téléphones sont équipés de Gemini Live et seront mis en vente en août. Google a déclaré que les utilisateurs de Pixel 9 Pro, Pixel 9 Pro XL et Pixel 9 Pro Fold peuvent bénéficier d'un abonnement Gemini Advanced d'un an après l'achat du téléphone. Il semble que par rapport à la série iPhone 16 équipée de grands modèles OpenAI, Google ait cette fois pris une longueur d'avance.

Google a introduit une série de fonctionnalités d'IA générative pour Pixel.

Parmi eux, Pixel Studio peut vous aider à transformer des idées en images sur votre téléphone. Il est composé d'un modèle de diffusion côté appareil fonctionnant sur Tensor G4 et d'un modèle texte-image Imagen 3 dans le cloud.



Le nouveau modèle d'image de Google, Imagen 3, a été présenté pour la première fois lors de la conférence I/O en mai. Le modèle a été optimisé et amélioré en termes de génération de détails, d'éclairage, d'interférences, etc., et sa capacité à comprendre les invites a été considérablement améliorée. Lors de la conférence de presse d'aujourd'hui, Google DeepMind a soumis un article Imagen 3 sur arXiv :



  • Lien papier : https://arxiv.org/abs/2408.07009

Pixel Screenshots vous aide à enregistrer, organiser et rappeler les informations importantes dont vous souhaitez vous souvenir pour plus tard.

Disons que vous avez une amie qui aime les écureuils et que c'est bientôt son anniversaire. Vous pouvez rechercher des cadeaux et prendre des captures d'écran de chemises d'écureuil, de dessous de verre d'écureuil et de tout ce qui concerne les écureuils sur Google Chrome. Pixel Screenshots analysera le contenu de toutes ces images et vous aidera à rechercher ces informations dans votre application. Ensuite, ouvrez simplement l'application et recherchez « écureuil » et ces résultats apparaîtront. Il comprendra également des liens vers tout ce que vous trouvez, ainsi qu'un résumé et des informations connexes sur le contenu que vous consultez.



L’une des choses les plus courantes que les gens font sur leur téléphone est de consulter la météo. Pixel Weather peut fournir des informations météorologiques plus précises, et Gemini Nano générera également des rapports météorologiques personnalisés par l'IA pour permettre aux gens de comprendre les conditions météorologiques du jour.

En ce qui concerne la prise de photos dont tous les téléphones mobiles ont besoin, le Pixel 9 ajoute des fonctions de prise de vue IA pour améliorer l'efficacité de la production cinématographique.

Souvent, un photographe désigné manque sur les photos de groupe. Avec Add Me, vous pouvez prendre des photos avec toutes les personnes présentes dans la pièce sans avoir à transporter un trépied ni à demander de l'aide à des inconnus.



Avec le Panorama repensé, vous pouvez désormais prendre des photos détaillées même dans des conditions de faible luminosité. Il s'agit du panorama en basse lumière de la plus haute qualité disponible sur n'importe quel smartphone.



De plus, Magic Editor dans Google Photos dispose de nouvelles fonctionnalités d'édition qui vous permettent de prendre la photo que vous souhaitez. La fonction de cadrage automatique peut recomposer la photo et il vous suffit de saisir ce que vous voulez voir (par exemple : ajouter des fleurs sauvages dans un champ vide). champ) Autrement dit, vous pouvez recomposer des photos et transformer vos idées en réalité.

L'enregistrement intelligent des appels des grands modèles est désormais également intégré au système Android. La fonction Clear Calling améliore encore la qualité audio et la nouvelle fonctionnalité Call Notes envoie un résumé privé et une transcription complète de l'appel dès que l'utilisateur raccroche. Ainsi, lorsque vous recevez un rappel, vous n’avez pas besoin de chercher du papier et un stylo pour prendre des notes. Pour protéger la confidentialité, l'enregistrement des appels s'exécute entièrement sur l'appareil.



Les derniers appareils Pixel 9 sont les premiers téléphones Android à proposer la nouvelle fonctionnalité SOS par satellite, permettant aux utilisateurs de contacter les services d'urgence et de partager leur position par satellite même en l'absence de réseau mobile. Satellite SOS sera disponible en premier sur les appareils Pixel 9 aux États-Unis, quel que soit le forfait de votre opérateur. Cette fonctionnalité sera gratuite les deux premières années sur Pixel.



Enfin, les prix des Pixel 9, Pixel 9 Pro et Pixel 9 Pro XL sont tous disponibles en précommande, à partir de 799 $, 999 $ et 1 099 $ respectivement. Les Pixel 9 et Pixel 9 Pro XL seront disponibles le 22 août dans le Google Store et chez les partenaires commerciaux de Google. Le Pixel 9 Pro sera disponible aux États-Unis le 4 septembre, tandis que le Pixel 9 Pro Fold sera disponible sur d'autres marchés dans les semaines à venir.

Contenu de référence :

https://blog.google/products/pixel/google-pixel-9-pro-xl/

https://www.androidauthority.com/google-tensor-g4-explained-3466184/