notícias

gpt-4o jogou "black myth: wukong", o "cavalo" da ia ​​​​cuidou do chefe e a taxa de vitórias foi sobre-humana

2024-09-28

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

o jogo "black myth: wukong" é apenas um monstro?

confesso que quando meu amigo me questionou assim, naquele momento, quebrei a guarda.

levei apenas menos de meio dia desde a percepção de que yang jian deve ser capturado até a morte do tiger vanguard. se quisermos limpar o “mito negro”, podemos contar com a ia?

role e desvie, mantenha distância e tenha uma visão clara dos movimentos do monstro.

quando chegou a hora, o homem do destino de repente balançou sua pesada vara.

com a ajuda do poder da ia, um combo suave foi realizado e o chefe foi derrotado sem capacidade de revidar. não sei quantos jogadores estão chorando.

a equipe de pesquisa do alibaba propôs recentemente uma estrutura de agente varp. e este "cavalo" de ia foi feito por eles.

pode-se dizer que não é um plug-in, mas é melhor que um plug-in.

os gpts que enfrentaram o grande sábio não eram piores que os humanos.

quando a ia enfrenta o grande sábio, na verdade não é tão complicado.

tradicionalmente, a ia de jogos depende de apis de jogos para obter informações ambientais e dados de ações executáveis. mas o problema é que nem todo jogo está disposto a fornecer uma api aberta, ou mesmo que seja fornecida, algumas apis carecem de braços e pernas, dificultando o atendimento às necessidades reais.

além disso, os métodos tradicionais sempre parecem que falta algo e não conseguem simular totalmente a experiência real de jogo dos jogadores humanos.

com base nisso, a equipe de pesquisa do alibaba propôs uma nova estrutura de agente varp (vision action role-playing).

depois de receber capturas de tela do jogo de entrada, a estrutura do agente varp realiza inferência usando um conjunto de vlms e, finalmente, gera código em formato python para controlar o personagem do jogo, incluindo uma combinação de uma série de comandos atômicos, como ataque leve, esquiva, ataque pesado e recuperação da saúde espere.

o varp contém três bases de conhecimento: base de situação, base de ação e base de orientação humana, e dois sistemas: sistema de planejamento de ação e sistema de trajetória de orientação humana.

simplificando, o sistema de planejamento de ações equivale a um bibliotecário, responsável por encontrar os materiais mais apropriados na biblioteca de situações e na biblioteca de ações atualizável.

com base nas capturas de tela do jogo de entrada, o sistema seleciona ou gera ações que se adequam à situação atual e, em seguida, essas ações e situações são armazenadas ou atualizadas nessas duas bibliotecas.

o sistema de trajetória guiada por humanos utiliza conjuntos de dados de operação humana para melhorar o desempenho do varp em tarefas complexas, como tarefas de localização de caminhos e tarefas de combate difíceis.

na biblioteca de ações, "def new_func_a()" representa uma nova ação gerada pelo sistema de planejamento de ações, enquanto "def new_func_h()" representa uma nova ação gerada pelo sistema de trajetória guiada por humanos. "def pre_func()" indica uma ação predefinida.

no jogo "black myth wukong" mencionado acima, a equipe de pesquisa definiu 12 tarefas, 75% das quais envolveram combate, e realizou testes de benchmark usando vlms, incluindo gpt-4o, claude 3.5 sonnet e gemini 1.5 pro.

os resultados mostram,varp tem uma taxa de vitória de até 90% em missões básicas e batalhas de dificuldade simples a média. no entanto, quando confrontado com tarefas difíceis, o desempenho do varp cai facilmente e o seu nível geral ainda não é tão bom quanto o dos jogadores humanos.

além disso, quando o agente varp processa decisões no jogo, ele não pode analisar cada quadro do jogo (ou seja, a tela do jogo) em tempo real porque depende da velocidade de inferência do modelo de linguagem visual (vlm).

em outras palavras, ele não pode reagir a tudo que acontece na tela quase instantaneamente como um jogador humano faz. em vez disso, ele só pode processar a filmagem do jogo a cada poucos segundos, selecionando alguns quadros importantes (quadros-chave) para análise e tomada de decisão.

quando "black myth: wukong" foi lançado, reclamou-se da falta de um mapa e da existência de um grande número de "paredes aéreas". portanto, sem assistência humana, a ia seria como uma mosca sem cabeça, incapaz de fazê-lo. encontre o chefe.

a ia generativa acendeu o fogo da mudança mundial antes de entrar na consciência pública, a ligação mais intuitiva das pessoas comuns com a ia pode ter origem principalmente nos jogos.

na história dos videogames, a ia é muito mais importante do que pensamos

muitas pessoas podem não ter pensado que um dos primeiros jogos a entrar no trem da ia ​​seria o clássico jogo de arcade “pac-man”.

o pré-requisito para a vitória do jogador é comer todos os feijões do labirinto, e os fantasmas coloridos aparentemente bobos têm algoritmos de perseguição diferentes e perseguirão o jogador de diferentes maneiras e caminhos.

os movimentos algorítmicos de cada fantasma são extremamente simples e carecem de qualquer capacidade de aprendizagem. assim que o jogador compreender essas regras, a dificuldade do jogo diminuirá.

“metal gear solid”, lançado em 1987, marcou outro marco importante na ia dos jogos.

os personagens de ia do jogo começaram a exibir padrões de comportamento mais complexos e, pela primeira vez, foi introduzido um mecanismo de resposta hostil aos jogadores. se o jogador for avistado pelo inimigo, o inimigo irá acionar o sistema de alarme, pedir reforços, alterar rotas de patrulha e até mesmo montar armadilhas.

mais tarde, se o processo de desenvolvimento de ia e jogos for brevemente listado em uma série de eventos marcantes, será aproximadamente o seguinte:

em 1997, o "deep blue" da ibm derrotou o campeão mundial humano em uma partida de xadrez, marcando um grande avanço para a ia em jogos de xadrez.

em 2004, foi lançado "half-life 2". os personagens de ia do jogo foram capazes de tomar decisões e interações mais complexas, melhorando a imersão do jogo.

em 2011, o "watson" da ibm derrotou o campeão humano no programa de perguntas e respostas "jeopardy!", demonstrando o progresso da ia ​​no processamento de linguagem natural e no raciocínio do conhecimento.

em 2016, alphago derrotou lee sedol no jogo go, marcando um grande avanço para a ia em jogos de estratégia complexos.

em 2018, foi lançado "red dead redemption 2". o nível de interação entre os personagens de ia do jogo e o ambiente foi bastante melhorado, proporcionando uma experiência de jogo altamente realista.

em 2020, a nvidia lançou a tecnologia dlss, que usa ia para acelerar a renderização gráfica e melhorar o desempenho dos jogos e a qualidade da imagem.

olhando para o ambiente de jogo atual, o jogo ainda foca no companheirismo, e a ia é como um amplificador, amplificando esse companheirismo inúmeras vezes.

na ces deste ano, a nvidia usou o avatar cloud engine (ace) para tornar os npcs de jogos "vivos" e se tornou popular na indústria.

na demo chamada kairos, os jogadores puderam interagir com jin, o dono da loja de ramen. embora jin seja apenas um npc, com a ajuda da ia ​​generativa, ele responde a perguntas como uma pessoa real.

a combinação de ia e jogos sempre faz as pessoas sentirem amor e ódio.

tomemos como exemplo os jogos competitivos. no passado, o método era apenas ajustar a dificuldade de forma rígida, mas agora é imitar as operações humanas para tornar a experiência de jogo mais realista.

os defensores acreditam que quando a ia de simulação humana se torna um oponente ou companheiro de equipe, ela pode, por sua vez, melhorar a sensação competitiva do jogo devido à falta de jogadores reais.

esta também é a desvantagem. a taxa de retenção do jogador foi melhorada, mas sob o controle do sistema, os jogadores não podem escapar do vórtice de serem jogados pela ia.

na fase inicial houve palavras ousadas, na fase intermediária houve bobagens e na fase posterior houve silêncio.

quando ficamos acordados a noite toda só para ganhar outro jogo, é difícil dizer se estamos jogando ou se o jogo está jogando contra nós.

especialmente quando você percebe que seus companheiros de equipe podem ser ia, a sensação de impotência é como um punho batendo em algodão. meu coração estava mole e sem foco.

velho profeta huang! os jogos futuros serão gerados por ia?

mesmo se você for um novato em codificação, podemos usar ia para jogar.

há alguns anos, isto provavelmente seria algo com que apenas poderíamos sonhar, mas a chegada da ia ​​generativa deu espaço para que tudo isto se concretizasse.

em um nível pequeno, é como criar um gpt para jogar um jogo de contar histórias. em um nível amplo, é um minijogo assistido por ia. embora a interatividade não seja interessante, é melhor do que os belos gráficos.

indo um passo adiante, até mesmo jogos de nível de obra-prima 3a poderão ser gerados diretamente por meio da renderização de ia no futuro.

no ano passado, o fundador da nvidia, jensen huang, previu quecada pixel em jogos futuros será gerado, não renderizado.quando isso foi dito na época, todos ainda poderiam estar hesitantes.

normalmente, pode levar uma semana para criar um ambiente para um jogo pequeno e mais para um projeto de estúdio, dependendo da complexidade do design.

no mês passado, o google deepmind anunciou seu primeiro “mecanismo de jogo de ia”gamengen

é capaz de simular o clássico jogo de tiro “doom” em tempo real a mais de 20 quadros por segundo em um único chip tpu.

funciona usando um modelo de difusão para prever cada quadro em tempo real, o que significa que cada momento do jogo é gerado em tempo real com base nas complexas interações das ações do jogador e do ambiente.

naquela época, jim fan, cientista sênior da nvidia, não pôde deixar de suspirar que "doom", que era executado descontroladamente por hackers em vários lugares, foi na verdade implementado em um modelo de difusão pura, e cada pixel foi gerado.

mais tarde, resultados mais semelhantes estão surgindo.

não muito tempo atrás, a tencent também deu um grande passo e lançou um grande modelo especificamente para jogos de mundo aberto 3a——gamegen-o

gamegen-o pode simular personagens, ambientes dinâmicos e ações complexas em vários jogos aaa, como "the witcher 3", "cyberpunk 2077", "assassin's creed" e "black myth: wukong", e a qualidade do jogo gerado cenas também é muito alta

para construir o conjunto de dados, a tencent, que gastou muito dinheiro, coletou mais de 32.000 vídeos de jogos, cada vídeo durando apenas alguns minutos ou algumas horas, e então selecionou 15.000 vídeos disponíveis por meio de dados manuais. anotação.

esses vídeos selecionados são cortados em segmentos por meio de detecção de cena e, em seguida, rigorosamente classificados e filtrados com base na estética, análise de fluxo óptico e conteúdo semântico.

a electronic arts, uma desenvolvedora de jogos americana, também mostrou recentemente à indústria uma visão brilhante para a implementação futura de ia no desenvolvimento de jogos por meio de um vídeo intitulado “da imaginação à criação”.

no vídeo, os jogadores podem usar ferramentas de ia para criar cenas de jogos, personagens e outros conteúdos com apenas instruções simples.

ceo andrew wilson disseno futuro, a ia generativa pode melhorar mais de metade dos processos de desenvolvimento da empresa, deverá projetar e criar mundos de jogos maiores e mais envolventes dentro de três a cinco anos.

a ia pode não apenas melhorar a eficiência do desenvolvimento de jogos existentes, mas também criar novas experiências de jogo.

talvez você diga que não importa qual tecnologia avançada seja usada no jogo, em última análise, a diversão é rei.

mas quando o gta 6 saltou repetidamente e desapareceu, também podemos ter a ideia de fazer isso nós mesmos e ter comida e roupas suficientes.

afinal, seria muito bom se você pudesse criar uma “cidade do pecado” com suas próprias mãos.