nouvelles

le premier modèle national à grande échelle doté de « yeux » a été dévoilé au salon des services

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

le grand modèle national a réussi à ouvrir les « yeux » et zhipu ai (beijing zhipu huazhang technology co., ltd.) a présenté la dernière version claire à la foire internationale du commerce des services de chine 2024 (appelée foire du commerce des services). ), ouverte le 12 septembre. fonction « appel vidéo » de l’application yan. il s'agirait de la première fonction d'appel vidéo à grande échelle au monde ouverte aux utilisateurs publics.
selon les rapports, la fonction d'appel vidéo de qingyan couvre trois modes principaux : texte, audio et vidéo, et possède des capacités de raisonnement en temps réel. les utilisateurs peuvent allumer la caméra et communiquer avec qingyan via la fenêtre d'appel vidéo. qingyan peut non seulement « voir » l'écran de l'utilisateur, mais également comprendre les instructions et les exécuter avec précision, et peut répondre rapidement même en cas d'interruption fréquente. en mettant en évidence les points clés sur l'écran, qingyan peut également comprendre sur quoi l'utilisateur souhaite qu'il se concentre.
apporter une aide aux devoirs.
zhipu ai a déclaré que gpt-4o avait déjà lancé la voix mais n'avait pas ouvert la fonction vidéo au public. en utilisant qingyan, vous pouvez découvrir la technologie d'ia/grand modèle la plus avancée. dans le passé, l'interaction avec l'ia se faisait principalement sous forme de texte. grâce à la fonction vidéo, les utilisateurs peuvent dire adieu aux longues invites textuelles et communiquer en douceur avec l'ia. qingyan est comme un assistant humain avec une vision et une compréhension de l'utilisateur. tant que la caméra prend une photo, l'ia connaîtra l'environnement de l'utilisateur et ce qu'il veut que l'ia fasse. instructions.
le grand modèle domestique déverrouille avec succès les "yeux".
la fonction d'appel vidéo qingyan peut également être transformée en un traducteur anglais portable, capable de réaliser une traduction instantanée entre le chinois et l'anglais, de mener des conversations en anglais sur la base des informations environnementales de l'utilisateur et d'aider à corriger la prononciation et les erreurs grammaticales de l'utilisateur. les scénarios d'utilisation de cette fonction incluent le récit d'histoires de sites pittoresques à tout moment lors d'un voyage, l'identification de l'environnement pour les malvoyants, etc. elle peut également fournir un tutorat pour les devoirs et des conseils pour les entretiens, compléter des procès-verbaux et des résumés lors de réunions, analyser des données complexes. graphiques et interpréter les ordinateurs en temps réel.
lors de ce salon des services, zhipu ai présentera une variété de derniers produits. en plus de la fonction d'appel vidéo de l'application qingyan, elle comprend également une fonction vidéo générée par l'ia. zhipu a lancé le modèle de génération vidéo cogvideox plus tôt cette année et a lancé la fonction « qingying » de génération vidéo sur l'application zhipu qingyan. qingying est ouvert à tous les utilisateurs. entrez simplement du texte ou téléchargez une image, et une vidéo de 6 secondes peut être générée en 30 secondes. en juillet de cette année, qingying a lancé l'application qingyan et les utilisateurs ont généré plus d'un million de vidéos en six jours.
le journaliste du journal zhang jing
(cet article provient de the paper. pour plus d'informations originales, veuillez télécharger l'application « the paper »)
rapport/commentaires