2024-09-28
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
le jeu « black myth : wukong » n'est-il qu'un monstre ?
j'avoue que lorsque mon ami m'a interrogé ainsi, à ce moment-là, j'ai brisé ma garde.
il ne m'a fallu que moins d'une demi-journée entre la réalisation que yang jian devait être capturé jusqu'à la mort de tiger vanguard, si nous voulons effacer "black myth", pouvons-nous compter sur l'ia ?
roulez et esquivez, gardez la distance et ayez une vision claire des mouvements du monstre.
le moment venu, l’homme du destin balança soudain son lourd bâton.
avec l'aide de la puissance de l'ia, un combo fluide a été réalisé et le boss a été vaincu sans pouvoir riposter. je ne sais pas combien de joueurs pleurent.
l'équipe de recherche d'alibaba a récemment proposé un cadre d'agent varp. et ce "cheval" ia a été fabriqué par eux.
on peut dire que ce n'est pas un plug-in, mais c'est mieux qu'un plug-in.
les gpt qui ont affronté le grand sage n’étaient en réalité pas pires que les humains.
lorsque l’ia affronte le grand sage, ce n’est en réalité pas si compliqué.
traditionnellement, l’ia des jeux s’appuie sur les api des jeux pour obtenir des informations environnementales et des données d’action exécutables. mais le problème est que tous les jeux ne sont pas disposés à fournir une api ouverte, ou même si elle est fournie, certaines api manquent de bras et de jambes, ce qui rend difficile la satisfaction des besoins réels.
de plus, les méthodes traditionnelles donnent toujours l’impression qu’il manque quelque chose et ne peuvent pas simuler pleinement l’expérience de jeu réelle des joueurs humains.
sur cette base, l’équipe de recherche d’alibaba a proposé un nouveau cadre d’agent varp (vision action role-playing).
après avoir reçu des captures d'écran du jeu, le framework d'agent varp effectue une inférence à l'aide d'un ensemble de vlm et génère enfin du code sous forme python pour contrôler le personnage du jeu, y compris une combinaison d'une série de commandes atomiques, telles qu'une attaque légère, une esquive, une attaque lourde. , et la récupération de la santé attend.
varp contient trois bases de connaissances : base de situation, base d'action et base de guidage humain, et deux systèmes : système de planification d'action et système de trajectoire de guidage humain.
en termes simples, le système de planification d'actions est équivalent à un bibliothécaire, chargé de trouver les matériaux les plus appropriés dans la bibliothèque de situations et dans la bibliothèque d'actions actualisable.
sur la base des captures d'écran du jeu, le système sélectionne ou génère des actions adaptées à la situation actuelle, puis ces actions et situations sont stockées ou mises à jour dans ces deux bibliothèques.
le système de trajectoire guidé par l'homme utilise des ensembles de données d'opération humaine pour améliorer les performances du varp dans des tâches complexes, telles que les tâches de recherche de chemin et les tâches de combat difficiles.
dans la bibliothèque d'actions, "def new_func_a()" représente une nouvelle action générée par le système de planification d'action, tandis que "def new_func_h()" représente une nouvelle action générée par le système de trajectoire guidé par l'homme. "def pre_func()" indique une action prédéfinie.
dans le jeu "black myth wukong" mentionné ci-dessus, l'équipe de recherche a défini 12 tâches, dont 75 % impliquaient des combats, et a effectué des tests de référence à l'aide de vlm, notamment gpt-4o, claude 3.5 sonnet et gemini 1.5 pro.
les résultats montrent,varp a un taux de victoire allant jusqu'à 90 % dans les missions de base et les batailles de difficulté simple à moyenne. cependant, face à des tâches difficiles, les performances de varp chutent facilement et son niveau global n'est toujours pas aussi bon que celui des joueurs humains.
de plus, lorsque l'agent varp traite les décisions dans le jeu, il ne peut pas analyser chaque image de jeu (c'est-à-dire l'écran de jeu) en temps réel car il s'appuie sur la vitesse d'inférence du modèle de langage visuel (vlm).
en d’autres termes, il ne peut pas réagir presque instantanément à tout ce qui se passe à l’écran comme le ferait un joueur humain. au lieu de cela, il ne peut traiter les images du jeu qu'après quelques secondes, en sélectionnant certaines images importantes (images clés) pour l'analyse et la prise de décision.
lors du lancement de "black myth: wukong", on s'est plaint de l'absence de carte et de l'existence d'un grand nombre de "murs d'air". par conséquent, sans assistance humaine, l'ia serait comme une mouche sans tête incapable de le faire. trouvez le patron.
l’ia générative a allumé le feu du changement mondial avant d’entrer dans la conscience publique, le lien plus intuitif des gens ordinaires avec l’ia provenait peut-être principalement des jeux.
dans l’histoire du jeu vidéo, l’ia est bien plus importante qu’on ne le pense
beaucoup de gens n’auraient peut-être pas pensé que l’un des premiers jeux à monter dans le train de l’ia serait le jeu d’arcade classique « pac-man ».
la condition préalable à la victoire du joueur est de manger tous les haricots dans le labyrinthe, et les fantômes colorés apparemment idiots ont des algorithmes de poursuite différents, et ils poursuivront le joueur de différentes manières.
les mouvements algorithmiques de chaque fantôme sont extrêmement simples et manquent de toute capacité d'apprentissage. une fois que le joueur comprendra ces règles, la difficulté du jeu chutera.
"metal gear solid", lancé en 1987, a marqué une autre étape importante dans l'ia des jeux vidéo.
les personnages ia du jeu ont commencé à présenter des modèles de comportement plus complexes et, pour la première fois, un mécanisme de réponse hostile envers les joueurs a été introduit. si le joueur est repéré par l'ennemi, celui-ci déclenchera le système d'alarme, appellera des renforts, modifiera les itinéraires de patrouille et même posera des pièges.
plus tard, si le processus de développement de l’ia et des jeux est brièvement répertorié dans une série d’événements marquants, il se présente à peu près comme suit :
en 1997, "deep blue" d'ibm a vaincu le champion du monde humain dans un match d'échecs, marquant une avancée majeure pour l'ia dans les jeux d'échecs.
en 2004, "half-life 2" est sorti. les personnages ia du jeu étaient capables de prendre des décisions et des interactions plus complexes, améliorant ainsi l'immersion du jeu.
en 2011, « watson » d'ibm a vaincu le champion humain dans le jeu-questionnaire « jeopardy ! » démontrant les progrès de l'ia dans le traitement du langage naturel et le raisonnement des connaissances.
en 2016, alphago a battu lee sedol dans le jeu de go, marquant une avancée majeure pour l'ia dans les jeux de stratégie complexes.
en 2018, "red dead redemption 2" est sorti. le niveau d'interaction entre les personnages ia du jeu et l'environnement a été considérablement amélioré, offrant une expérience de jeu très réaliste.
en 2020, nvidia a lancé la technologie dlss, qui utilise l'ia pour accélérer le rendu graphique et améliorer les performances des jeux et la qualité de l'image.
en regardant l'environnement de jeu actuel, le jeu se concentre toujours sur la camaraderie, et l'ia est comme un amplificateur, amplifiant cette camaraderie d'innombrables fois.
lors du salon ces de cette année, nvidia a utilisé avatar cloud engine (ace) pour rendre les pnj de jeu « vivants » et est devenu populaire dans l'industrie.
dans la démo appelée kairos, les joueurs pouvaient interagir avec jin, le propriétaire du magasin de ramen. bien que jin ne soit qu’un pnj, avec l’aide de l’ia générative, il répond aux questions comme une vraie personne.
la combinaison de l’ia et des jeux fait toujours ressentir aux gens à la fois de l’amour et de la haine.
prenons l'exemple des jeux compétitifs. dans le passé, la méthode consistait simplement à ajuster la difficulté de manière rigide, mais il s'agit désormais d'imiter les opérations humaines pour rendre l'expérience de jeu plus réaliste.
les partisans pensent que lorsque l’ia simulant des humains devient un adversaire ou un coéquipier, elle peut à son tour améliorer le sentiment de compétition du jeu en raison du manque de vrais joueurs.
c'est aussi l'inconvénient. le taux de rétention des joueurs a été amélioré, mais sous le contrôle du système, les joueurs ne peuvent pas échapper au vortex d'être joué par l'ia.
au début, il y avait des paroles audacieuses, au milieu, il y avait des absurdités, et plus tard, il y avait le silence.
lorsque nous restons éveillés toute la nuit juste pour gagner un autre jeu, il est difficile de dire si nous jouons au jeu ou si le jeu nous joue.
surtout lorsque vous réalisez que vos coéquipiers peuvent être des ia, le sentiment d'impuissance est comme un coup de poing frappant du coton. mon cœur était mou et je n’avais aucune concentration.
vieux prophète huang ! les futurs jeux seront-ils générés par l’ia ?
même si vous êtes novice en codage, nous pouvons utiliser l’ia pour jouer à des jeux.
il y a quelques années, cela aurait probablement été quelque chose dont nous ne pouvions que rêver, mais l’arrivée de l’ia générative a permis à tout cela de se concrétiser.
à un petit niveau, c'est comme créer un gpt pour jouer à un jeu de narration. à un grand niveau, c'est un mini-jeu de programme assisté par l'ia. bien que l'interactivité ne soit pas intéressante, elle vaut mieux que les beaux graphismes.
en allant encore plus loin, même les jeux de niveau chef-d'œuvre 3a pourraient à l'avenir être générés directement via le rendu de l'ia.
l'année dernière, le fondateur de nvidia, jensen huang, a prédit quechaque pixel des futurs jeux sera généré et non rendu.quand cela a été dit à l’époque, tout le monde était peut-être encore hésitant.
en règle générale, la création d'un environnement pour un petit jeu peut prendre une semaine et plus pour un projet en studio, en fonction de la complexité de la conception.
le mois dernier, google deepmind a annoncé son premier « moteur de jeu ia »gamengen。
il est capable de simuler le jeu de tir classique « doom » en temps réel à plus de 20 images par seconde sur une seule puce tpu.
il fonctionne en utilisant un modèle de diffusion pour prédire chaque image en temps réel, ce qui signifie que chaque instant du jeu est généré en temps réel en fonction des interactions complexes des actions du joueur et de l'environnement.
à cette époque, jim fan, scientifique principal de nvidia, ne pouvait s'empêcher de soupirer que "doom", qui était sauvagement géré par des pirates informatiques à divers endroits, était en fait implémenté dans un modèle de diffusion pure et que chaque pixel était généré.
plus tard, des résultats plus similaires apparaissent.
il n'y a pas si longtemps, tencent a également fait un grand pas en avant et a lancé un grand modèle spécifiquement pour les jeux en monde ouvert 3a——gamegen-o。
gamegen-o peut simuler des personnages, des environnements dynamiques et des actions complexes dans divers jeux aaa, tels que « the witcher 3 », « cyberpunk 2077 », « assassin's creed » et « black myth : wukong », ainsi que la qualité du jeu généré. les scènes sont également très élevées
afin de constituer l'ensemble de données, tencent, qui a dépensé beaucoup d'argent, a collecté plus de 32 000 vidéos de jeux, chaque vidéo ne durait que quelques minutes ou quelques heures, puis a sélectionné 15 000 vidéos disponibles via des données manuelles. annotation.
ces vidéos organisées sont découpées en segments grâce à la détection de scène, puis rigoureusement triées et filtrées en fonction de l'esthétique, de l'analyse du flux optique et du contenu sémantique.
electronic arts, un développeur de jeux américain, a également récemment montré à l'industrie une vision brillante de la future mise en œuvre de l'ia dans le développement de jeux à travers une vidéo intitulée « de l'imagination à la création ».
dans la vidéo, les joueurs peuvent utiliser des outils d'ia pour créer des scènes de jeu, des personnages et d'autres contenus avec des instructions simples.
le pdg andrew wilson a déclaréà l’avenir, l’ia générative pourra améliorer plus de la moitié des processus de développement des entreprises, devrait concevoir et créer des mondes de jeu plus grands et plus immersifs d’ici trois à cinq ans.
l'ia peut non seulement améliorer l'efficacité du développement des jeux existants, mais également créer de nouvelles expériences de jeu.
peut-être direz-vous que quelle que soit la technologie avancée utilisée dans le jeu, en dernière analyse, le plaisir est roi.
mais lorsque gta 6 a rebondi à plusieurs reprises et a disparu, nous pouvons aussi avoir l'idée de le faire nous-mêmes et d'avoir suffisamment de nourriture et de vêtements.
après tout, ce serait plutôt bien si vous pouviez créer une « sin city » de vos propres mains.