nouvelles

nous avons passé un appel vidéo à l'ia et avons constaté qu'elle semblait pouvoir parler de tout. . .

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


lors de la conférence openai il y a trois mois, je pense que certains d'entre vous ont vu gpt-4o. c'était comme une vraie personne.capacités de conversation vidéo soyeuses.

il existe également le projet astra lancé par google, qui n'est pas inférieur au gpt-4o en termes de force.


à cette époque, presque tout l’internet se vantait de la puissance de l’évolution des capacités interactives de l’ia, et des termes tels qu’epic et next level étaient utilisés.

que s'est-il passé ? la fonction d'appel vidéo promise par gpt-4o a été retardée à maintes reprises et n'a pas été vue depuis plusieurs mois.chacun d’entre eux est presque énervé par les mauvais critiques. . .

cependant, j’ai découvert qu’il semble y avoir une règle dans le cercle de l’ia, à savoir qu’on ne peut pas faire attendre les gens trop longtemps pour de bonnes choses. vous voyez, sora est restée secrète pendant plus de six mois. en conséquence, keling, luma ai et zhipu qingying sont tous apparus l'un après l'autre.

au cours des deux derniers jours, lors de la conférence sur l'exploration de données kdd à barcelone, zhipu s'est présenté devant la communauté universitaire mondiale et l'industrie.non seulement le dernier grand modèle de base glm-4-plus a été lancé, mais il a également mis à niveau la fonction d'appel vidéo de zhipu qingyan.


permettez-moi de souligner les points clés pour tout le monde.c'est celui de la légende qui peut voir et discuteriala fonction d'appel vidéo est désormais disponible directement dans l'application qingyan. vous pouvez d'abord télécharger l'application et demander un essai.

ne parlons de rien d'autre. par rapport à openai, la vitesse de zhipu est déjà meilleure que celle d'openai. . .

par conséquent, dès que la fonction d'appel vidéo de qingyan a été lancée, m. bianbing a été le premier à l'utiliser. ouvrez l'application qingyan, cliquez sur le bouton d'appel dans le coin inférieur droit, puis passez à la vidéo et commencez à jouer directement ~


les amis doivent également savoir que l’une des raisons importantes pour lesquelles gpt-4o est si populaire est qu’il possède une capacité très puissante à comprendre les vidéos.

quant à la chose la plus fondamentale, la capacité de compréhension vidéo de qingyan doit d'abord être testée, n'est-ce pas ?

le critique a donné à qingyan un aperçu de la salle de conférence où notre département éditorial réfléchit habituellement, pour voir s'il pouvait deviner ce que je faisais en fonction de l'environnement. il a également délibérément secoué la caméra sans garder la vidéo complètement immobile.

devinez quoi, le simple fait de dire « wow, devinez ce que vous faites » m'a presque donné du fil à retordre. mais s'asseoir à table dans la salle de conférence n'est pas faux. les gobelets en papier sur la table, la télécommande et la télévision à côté sont également décrits avec assez de précision.

lorsque j’ai placé l’objectif sur l’ordinateur de mon collègue, j’ai pu voir qu’il était en train de monter une vidéo.

ne me dites pas, ce genre de capacité à percevoir l'environnement global qui vous entoure n'a été vu auparavant que dans openai et dans la démo de google. aujourd'hui, j'en ai personnellement fait l'expérience. j'ai vraiment l'impression que la science-fiction est devenue réalité.

de plus, qingyan est le même que celui démontré par gpt-4o.vous pouvez interrompre à tout moment pendant la conversation.de temps en temps, il utilisera également les mots modaux « aïe » et « aïe » et rira avant de parler, tout comme discuter avec une vraie personne.

ensuite, j'ai essayé la fonction de reconnaissance d'objets spécifiques pour voir la réserve de connaissances de qingyan.

à partir de l'analyse la plus simple du poste de travail, il ne manque pratiquement aucun élément volumineux tel que des claviers blancs, des souris noires et des moniteurs. les directions avant, arrière, gauche et droite des objets sont également clairement décrites, même les écouteurs enfichables et. les personnages de dessins animés sur le verre.

je ne peux pas dire à 100%, mais sur cette tableau moins 80 % à 90 %tout a été vu par qingyan.

de plus, qingyan a également une autre fonction, c'est-à-direreconnaissance de cercle, j’ai encerclé à distance la grande chaîne stéréo de mon collègue. il connaissait la marque, le modèle et même son objectif spécifique.

bien qu'il y ait des mots sur les haut-parleurs, tout le monde devrait pouvoir voir la clarté à l'œil nu. je dois dire que les yeux clairs sont vraiment faciles à utiliser. . .

de plus, j'ai aussi constaté quela reconnaissance des objets par qingyan va au-delà des simples catégories.

par exemple, si vous demandez si cette manette de jeu provient de sony ou de microsoft, il peut l'analyser en fonction de la forme de la manette. il s'agit de la xbox de microsoft. au lieu de simplement vous dire qu'il s'agit d'un contrôleur de jeu, ou simplement de le confondre et de ne pas pouvoir l'expliquer clairement.

il y a aussi les détails de cet ancien téléphone multifonction, nokia, le modèle spécifique est le n95 et le modèle classique de 2007.

plus tard, j'ai demandé à qingyan d'identifier le système informatique, de deviner l'âge de tony en regardant les photos de tony et de deviner les noms des personnes en regardant les photos de célébrités. . . disons-le ainsi, depuis que j'ai commencé à utiliser qingyan, je souhaite maintenant ouvrir un appel vidéo et poser des questions sur tout ce que j'attrape.

bien sûr, c’est amusant. il existe de nombreuses formes d’appels vidéo.scénarios pratiques

prenons comme exemple la recherche quotidienne de sujets et de documents par notre département éditorial. les points chauds de l'industrie automobile ces deux jours sont fondamentalement indissociables du salon de l'auto de chengdu. en ce moment, vous pouvez interroger qingyan sur le salon de l'auto de chengdu et rechercher. sujets pendant la conversation inspiration.

surtout, j'ai aussi découvert que qingyan avaitfonction mémoire, je lui en ai parlé lors du dernier appel vidéo, et la prochaine fois que je l'ai ouvert, il est venu et m'a demandé quels véhicules à énergie nouvelle au salon de l'auto je suivais.

il y a aussi le tutorat aux devoirs, qui est la chose la plus gênante pour les parents. dans le passé, l'interaction avec l'ia était encore basée sur la prise de photos et le téléchargement de questions, mais si elle est remplacée par des appels vidéo, ce sera la même chose qu'en tête-à-tête. un tutorat aux devoirs avec des tuteurs en ligne.

j'ai essayé de demander à qingyan de résoudre des problèmes de mathématiques de faible difficulté.certaines questions simples d'algèbre à l'école primaire et au collège peuvent à peine être résolues.

je ne sais pas si vous avez remarqué que lors de la résolution de problèmes, qingyan ne vous expliquera pas tout le processus en même temps et ne vous donnera pas non plus un seul résultat. il vous guidera étape par étape, vous permettant d'avoir un processus de réflexion.

en plus des mathématiques, j'ai également essayé le chinois et l'anglais un par un. qingyan ne peut pas être considéré comme un enseignant senior, mais.c'est tout à fait suffisant pour les devoirs quotidiens, la mémorisation de mots et la mémorisation de poèmes anciens.

si vous pensez que ces scènes ne suffisent pas, faisons preuve d'un peu plus d'imagination.

je n’ai aucune expérience en cuisine pour la première fois, l’ampoule de ma chambre est cassée et je ne sais pas comment faire pousser des plantes vertes. . . si vous rencontrez des choses similaires dans la vie et que vous ne savez pas quoi faire, pourquoi ne pas demander à qingyan.

par exemple, de nombreux enfants ne sont peut-être pas capables de distinguer les pôles positifs et négatifs de la batterie pour le moment, nous avons donc fait semblant d'installer la batterie de la calculatrice à l'envers et avons compris quel était le problème en quelques mots, ce qui montre qu'il a encore du bon sens dans la vie.

quoi qu'il en soit, j'utilise qingyan ces jours-ci, j'aime le chercher quand je n'ai rien à faire. de plus, ce gadget est particulièrement capableapporter une valeur émotionnelle, laissez-le raconter des histoires et des blagues et répondez à chaque phrase.

jouez au blackjack avec des amis et il peut même faire office d'arbitre.

je me demande si nous pouvons évoluer au point de pouvoir jouer au mahjong à l'avenir et laisser l'ia prendre le dessus. n'est-ce pas plus intéressant que les conversations originales dactylographiées et vocales ?

pour être honnête, cette mise à jour majeure de qingyan m'a encore apporté pas mal de surprises, mais il y a encore parfois pas mal de petits défauts.il peut dire des bêtises, mal identifier les choses et produire des bêtises.


par exemple, lorsque j'étais arbitre de blackjack, j'ai dit un jour qu'un 9 était un 4 et qu'un pique était un trèfle. . .

cependant, simplement en rendant les appels vidéo ia disponibles en chine avant openai et google,nous devons également féliciter zhipu.

cette fois, le premier lot de fonctions d'appel vidéo ne sera disponible que pour certains utilisateurs. zhipu étendra progressivement son échelle afin que tous les employés puissent l'utiliser le plus rapidement possible. si vous êtes vraiment gourmands,vous pouvez télécharger l'application qingyan ou vous connecter au pc (chatglm.cn) pour postuler aux tests internes sur le site.

de plus, il peut y avoir de nombreux amis qui ne connaissent pas zhipu. disons-le de cette façon, cette société peut également être considérée comme la meilleure du cercle de l'ia.poulet frit populaire.


surtout cette année, leurs actions sur les grands modèles sont extrêmement féroces, de l'itération folle des grands modèles de base à la mise en œuvre fréquente d'applications de grands modèles, les actions de zhipu ne se sont jamais arrêtées.

lors de ce kdd, leur nouveau grand modèle glm-4-plus a apporté de grandes améliorations dans la compréhension du langage et des textes longs.


de plus, zhipu a insisté pour rendre les modèles open source. les données montrent que les téléchargements cumulés des modèles open source de zhipu ont été.dépassé les 20 millions.

quoi qu'il en soit, zhipu prend les devants en créant une telle « agitation » cette fois-ci. on estime que les cercles nationaux et même étrangers de l'ia inaugureront bientôt une vague de nouveaux produits fous.


c'est naturellement une bonne chose pour nous, les utilisateurs. surtout pour les appels vidéo ia, une nouvelle forme d'interaction, plus on va loin, plus la marge d'imagination dans les scénarios d'application est grande.

par exemple, si l'ia est installée sur des lunettes ou des colliers, vous n'aurez peut-être même plus besoin d'un téléphone portable à l'avenir, ou elle peut être installée sur la béquille d'une personne aveugle pour aider à guider le chemin, ou elle peut être combinée avec une intelligence incarnée pour permettre le robot pour vraiment comprendre ce qu'il voit.

pour emprunter les mots du pdg de zhipu, zhang peng :"au moins, nous ne l'avons pas encore vu (ia) plafond technologique ».

autant réfléchir à l’ampleur de l’évolution future de l’ia et à la valeur qu’elle créera.

écrire un article: xixi

modifier:jiangjiang

editeur artistique:huanyan

images, sources

des paroles claires de sagesse

une partie du réseau de sources d'images