gpt-4o vence "black myth wukong"! "cavalo" de ia pode controlar o chefe com uma taxa de vitória sobre-humana

gpt-4o vence "black myth wukong"! ai "ma men" pode controlar o boss e tem uma taxa de vitórias sobre-humana

2024-09-28

o jogo "black myth: wukong" é apenas um monstro?

confesso que quando meu amigo me questionou assim, naquele momento, quebrei a guarda.

levei apenas menos de meio dia para perceber que devo capturar yang jian e que devo apoiar o pioneiro tigre até a morte, e se eu quiser limpar "mito negro》, podemos contar com ia?

role e desvie, mantenha distância e tenha uma visão clara dos movimentos do monstro.

quando chegou a hora, o homem do destino de repente balançou sua pesada vara.

com a ajuda do poder da ia, um conjunto de combos suaves foi executado e o chefe foi derrotado sem capacidade de revidar. não sei quantos jogadores estão chorando.

a equipe de pesquisa do alibaba propôs recentemente uma estrutura de agente varp. e este "cavalo" de ia foi feito por eles.

pode-se dizer que não é um plug-in, mas é melhor que um plug-in.

os gpts que enfrentaram o grande sábio não eram piores que os humanos.

a ia enfrentando o grande sábio não é tão complicada.

tradicionalmente, a ia de jogos depende de apis de jogos para obter informações ambientais e dados de ações executáveis. mas o problema é que nem todo jogo está disposto a fornecer uma api aberta, ou mesmo que seja fornecida, algumas apis têm poucos braços e pernas, dificultando o atendimento às necessidades reais.

além disso, os métodos tradicionais sempre parecem que falta algo e não conseguem simular totalmente a experiência real de jogo dos jogadores humanos.

com base nisso, a equipe de pesquisa do alibaba propôs uma nova estrutura de agente varp (vision action role-playing).

depois de receber capturas de tela do jogo de entrada, a estrutura do agente varp realiza inferência usando um conjunto de vlms e, finalmente, gera código em formato python para controlar o personagem do jogo, incluindo uma combinação de uma série de comandos atômicos, como ataque leve, esquiva, ataque pesado e recuperação da saúde espere.

o varp contém três bases de conhecimento: base de situação, base de ação e base de orientação humana, e dois sistemas: sistema de planejamento de ação e sistema de trajetória de orientação humana.

simplificando, o sistema de planejamento de ações equivale a um bibliotecário, responsável por encontrar os materiais mais apropriados na biblioteca de situações e na biblioteca de ações atualizável.

com base nas capturas de tela do jogo de entrada, o sistema seleciona ou gera ações que se adequam à situação atual e, em seguida, essas ações e situações são armazenadas ou atualizadas nessas duas bibliotecas.

o sistema de trajetória guiada por humanos utiliza conjuntos de dados de operação humana para melhorar o desempenho do varp em tarefas complexas, como tarefas de localização de caminhos e tarefas de combate difíceis.

na biblioteca de ações, "def new_func_a()" representa uma nova ação gerada pelo sistema de planejamento de ações, enquanto "def new_func_h()" representa uma nova ação gerada pelo sistema de trajetória guiada por humanos. "def pre_func()" representa uma ação predefinida.

no jogo "black myth wukong" mencionado acima, a equipe de pesquisa definiu 12 tarefas, 75% das quais envolveram combate, e realizou testes de benchmark usando vlms, incluindo gpt-4o, claude 3.5 sonnet e gemini 1.5 pro.

os resultados mostram que o varp tem uma taxa de vitória de até 90% em tarefas básicas e batalhas de dificuldade simples a média. no entanto, quando confrontado com tarefas difíceis, o desempenho do varp cai facilmente e o seu nível geral ainda não é tão bom quanto o dos jogadores humanos.

além disso, quando o agente varp processa decisões no jogo, ele não pode analisar cada quadro do jogo (ou seja, a tela do jogo) em tempo real porque depende da velocidade de inferência do modelo de linguagem visual (vlm).

em outras palavras, ele não pode reagir a tudo que acontece na tela quase instantaneamente como um jogador humano faz. em vez disso, ele só pode processar a filmagem do jogo a cada poucos segundos, selecionando alguns quadros importantes (quadros-chave) para análise e tomada de decisão.

quando "black myth: wukong" foi lançado, reclamou-se da falta de um mapa e da existência de um grande número de "paredes aéreas". portanto, sem assistência humana, a ia seria como uma mosca sem cabeça, incapaz de fazê-lo. encontre o chefe.

a ia generativa acendeu o fogo da mudança mundial e, antes de entrar na consciência pública, o vínculo mais intuitivo das pessoas comuns com a ia pode ter se originado principalmente dos jogos.

a ia é muito mais importante na história dos videogames do que pensávamos

muitas pessoas podem não ter pensado que um dos primeiros jogos a entrar no trem da ia seria o clássico jogo de arcade “pac-man”.

o pré-requisito para a vitória do jogador é comer todos os feijões do labirinto, e os fantasmas coloridos aparentemente bobos têm algoritmos de perseguição diferentes e perseguirão o jogador de diferentes maneiras e caminhos.

os movimentos algorítmicos de cada fantasma são extremamente simples e carecem de qualquer capacidade de aprendizagem. assim que o jogador compreender essas regras, a dificuldade do jogo diminuirá.

“metal gear solid”, lançado em 1987, marcou outro marco importante na ia dos jogos.

os personagens de ia do jogo começaram a exibir padrões de comportamento mais complexos e, pela primeira vez, foi introduzido um mecanismo de resposta hostil aos jogadores. se o jogador for avistado pelo inimigo, o inimigo irá acionar o sistema de alarme, pedir reforços, alterar rotas de patrulha e até mesmo montar armadilhas.

mais tarde, se o processo de desenvolvimento de ia e jogos for brevemente listado em uma série de eventos marcantes, será aproximadamente o seguinte:

em 1997, o "deep blue" da ibm derrotou o campeão mundial humano em uma partida de xadrez, marcando um grande avanço para a ia em jogos de xadrez.

em 2004, foi lançado "half-life 2". os personagens de ia do jogo foram capazes de tomar decisões e interações mais complexas, melhorando a imersão do jogo.

em 2011, o "watson" da ibm derrotou o campeão humano no programa de perguntas e respostas "jeopardy!", demonstrando o progresso da ia no processamento de linguagem natural e no raciocínio do conhecimento.

em 2016, alphago derrotou lee sedol no jogo go, marcando um grande avanço para a ia em jogos de estratégia complexos.

em 2018, foi lançado "red dead redemption 2". o nível de interação entre os personagens de ia do jogo e o ambiente foi bastante melhorado, proporcionando uma experiência de jogo altamente realista.

em 2020, a nvidia lançou a tecnologia dlss, que usa ia para acelerar a renderização gráfica e melhorar o desempenho dos jogos e a qualidade da imagem.

olhando para o ambiente de jogo atual, o jogo ainda foca no companheirismo, e a ia é como um amplificador, amplificando esse companheirismo inúmeras vezes.

na ces deste ano, a nvidia usou o avatar cloud engine (ace) para tornar os npcs de jogos “vivos” e se tornou popular na indústria.

em uma demonstração chamada kairos, os jogadores puderam interagir com jin, dono de uma loja de ramen. embora jin seja apenas um npc, com a ajuda da ia generativa, ele responde a perguntas como uma pessoa real.

a combinação de ia e jogos sempre foi uma combinação de amor e ódio.

tomemos como exemplo os jogos competitivos. no passado, o método era apenas ajustar a dificuldade de forma rígida, mas agora é imitar as operações humanas para tornar a experiência de jogo mais realista.

os defensores acreditam que quando a ia de simulação humana se torna um oponente ou companheiro de equipe, ela pode, por sua vez, melhorar a sensação competitiva do jogo devido à falta de jogadores reais.

esta também é a desvantagem. a taxa de retenção dos jogadores foi melhorada, mas sob o controle do sistema, os jogadores não podem escapar do vórtice de serem jogados pela ia.

na fase inicial houve palavras ousadas, na fase intermediária houve bobagens e na fase posterior houve silêncio.

quando ficamos acordados a noite toda só para ganhar outro jogo, é difícil dizer se estamos jogando ou se o jogo está jogando contra nós.

especialmente quando você percebe que seus companheiros de equipe podem ser ia, a sensação de impotência é como um punho batendo em algodão.meu coração estava mole e sem foco.

velho profeta huang! os jogos futuros serão gerados por ia?

mesmo se você for um novato em codificação, podemos usar ia para jogar.

há alguns anos, isto provavelmente seria algo com que apenas poderíamos sonhar, mas a chegada da ia generativa deu espaço para que tudo isto se concretizasse.

em pequena escala, é como criar um gpt e contar histórias. em grande escala, é um minijogo assistido por ia. embora a interatividade não seja tão interessante, é melhor do que os belos gráficos.

indo um passo adiante, até mesmo jogos de nível de obra-prima 3a poderão ser gerados diretamente por meio da renderização de ia no futuro.

no ano passado, o fundador da nvidia, jensen huang, previu que cada pixel dos jogos futuros seria gerado em vez de renderizado. quando eu disse isso na época, todos ainda podem estar hesitantes.。

normalmente, pode levar uma semana para criar um ambiente para um jogo pequeno e mais para um projeto de estúdio, dependendo da complexidade do design.

no mês passado, o google deepmind anunciou seu primeiro “mecanismo de jogo de ia” gamengen.

ele pode simular o clássico jogo de tiro “doom” em tempo real a uma velocidade de mais de 20 quadros por segundo em um único chip tpu.

funciona usando um modelo de difusão para prever cada quadro em tempo real, o que significa que cada momento do jogo é gerado em tempo real com base nas complexas interações das ações do jogador e do ambiente.

naquela época, jim fan, cientista sênior da nvidia, não pôde deixar de suspirar que "doom", que estava sendo executado descontroladamente por hackers em vários lugares, foi na verdade implementado em um modelo de difusão pura, e cada pixel foi gerado.

mais tarde, resultados mais semelhantes estão surgindo.

não muito tempo atrás, a tencent também deu um grande passo e lançou um grande modelo específico para jogos de mundo aberto aaa - gamegen-o.

gamegen-o pode simular personagens, ambientes dinâmicos e ações complexas em vários jogos aaa, como "the witcher 3", "cyberpunk 2077", "assassin's creed" e "black myth: wukong", e a qualidade do gerado cenas de jogos também muito altas.

para construir o conjunto de dados, a tencent, que gastou muito dinheiro, coletou mais de 32.000 vídeos de jogos, cada vídeo poderia durar apenas alguns minutos ou algumas horas, e então selecionou 15.000 vídeos disponíveis por meio manual anotação de dados.

esses vídeos selecionados são cortados em segmentos por meio de detecção de cena e, em seguida, rigorosamente classificados e filtrados com base na estética, análise de fluxo óptico e conteúdo semântico.

a electronic arts, uma desenvolvedora de jogos americana, mostrou recentemente à indústria um futuro brilhante para a ia no desenvolvimento de jogos por meio de um vídeo “da imaginação à criação”.

no vídeo, os jogadores podem usar ferramentas de ia para criar cenas de jogos, personagens e outros conteúdos com apenas instruções simples.

o ceo andrew wilson disse que a ia generativa pode melhorar mais da metade dos processos de desenvolvimento da empresa no futuro e espera-se que projete e crie mundos de jogos maiores e mais envolventes dentro de três a cinco anos.

a ia pode não apenas melhorar a eficiência do desenvolvimento de jogos existentes, mas também criar potencialmente novas experiências de jogo.

talvez você diga que não importa qual tecnologia avançada seja usada no jogo, em última análise, a diversão é rei.

mas em gta 6. quando a verificação é atrasada repetidamente e nenhum vestígio é encontrado, também podemos ter a ideia de fazê-lo nós mesmos para ter comida e roupas suficientes.

afinal, seria muito bom se você pudesse construir uma “cidade do pecado” com suas próprias mãos.

notícias

gpt-4o vence "black myth wukong"! ai "ma men" pode controlar o boss e tem uma taxa de vitórias sobre-humana

introdução

minhas informações de contato