ニュース

gpt-4oが「黒神話悟空」を倒す! ai「マーメン」はボスをコントロールでき、超人的な勝率を誇る

2024-09-28

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

ゲーム「black myth: wukong」は単なるモンスターですか?
正直に言いますが、友人が私にこのように質問したとき、その瞬間、私は警戒を破りました。
楊堅を捕らえなければならないと悟りから、虎の先駆者を死ぬまで支援しなければならない、そしてクリアするには「黒い神話》ということですが、aiに頼っていいのでしょうか?
ロールして回避し、距離を保ち、モンスターの動きを明確に把握します。
時が来たとき、運命の人は突然重い棒を振りました。
aiの力を借りてスムーズなコンボが決まり、反撃もできずにボスを倒してしまったのは、どれだけのゲーマーが泣いているか分かりません。
アリババの研究チームは最近、varp エージェント フレームワークを提案しました。そしてこのai「馬」は彼らが作ったものです。
プラグインではありませんが、プラグインよりは優れていると言えます。
大賢者と対峙したgpt達は、本当に人間に劣らない存在だった。
大賢者と対峙するaiは実はそれほど複雑ではない。
従来、ゲーム ai はゲーム api に依存して環境情報と実行可能なアクション データを取得していました。しかし問題は、すべてのゲームがオープン api を積極的に提供するわけではなく、たとえ提供されたとしても、一部の api では手足が不足しており、実際のニーズを満たすことが困難であることです。
さらに、従来の方法では常に何かが欠けているように感じられ、人間のプレイヤーの実際のゲーム体験を完全にシミュレートすることができません。
これに基づいて、アリババの研究チームは、新しいvarp(ビジョンアクションロールプレイング)エージェントフレームワークを提案しました。
入力されたゲーム スクリーンショットを受信した後、varp エージェント フレームワークは一連の vlm を使用して推論を実行し、最終的に軽攻撃、回避、重攻撃などの一連のアトミック コマンドの組み合わせを含むゲーム キャラクターを制御するコードを python 形式で生成します。 、そして体力の回復を待ちます。
varp には、状況ベース、アクション ベース、ヒューマン ガイダンス ベースの 3 つの知識ベースと、アクション プランニング システムとヒューマン ガイダンス軌道システムの 2 つのシステムが含まれています。
簡単に言うと、アクション プランニング システムは図書館員に相当し、状況ライブラリと更新可能なアクション ライブラリから最適な資料を見つける責任を負います。
入力されたゲームのスクリーンショットに基づいて、システムは現在の状況に適合するアクションを選択または生成し、これらのアクションと状況はこれら 2 つのライブラリに保存または更新されます。
人間誘導軌道システムは人間の操作データ セットを使用して、経路探索タスクや困難な戦闘タスクなどの複雑なタスクにおける varp のパフォーマンスを向上させます。
アクションライブラリにおいて、「def new_func_a()」は行動計画システムが生成する新規アクションを表し、「def new_func_h()」は人誘導軌道システムが生成する新規アクションを表す。 「def pre_func()」は事前定義されたアクションを表します。
前述のゲーム「black myth wukong」では、研究チームは12のタスクを設定し、その75%が戦闘に関係し、gpt-4o、claude 3.5 sonnet、gemini 1.5 proを含むvlmを使用してベンチマークテストを実施しました。
結果は、varp が基本的なタスクと単純から中程度の難易度の戦闘で最大 90% の勝率を持っていることを示しています。ただし、難しいタスクに直面すると、varp のパフォーマンスは低下しやすく、全体的なレベルはまだ人間のプレイヤーのレベルには及びません。
さらに、varp エージェントがゲーム内の意思決定を処理する場合、視覚言語モデル (vlm) の推論速度に依存するため、すべてのゲーム フレーム (つまり、ゲーム画面) をリアルタイムで分析することはできません。
言い換えれば、人間のプレイヤーのように、画面上で起こっているすべてのことにほぼ瞬時に反応することはできません。代わりに、ゲーム映像を数秒ごとに処理し、分析と意思決定のためにいくつかの重要なフレーム (キーフレーム) を選択することしかできません。
「black myth: wukong」が発売されたとき、マップの欠如と多数の「空気の壁」の存在について苦情が寄せられました。そのため、人間の助けがなければ、ai は首のないハエのようなものになるでしょう。上司を見つけてください。
生成型 ai は世界変革の火を点けましたが、それが一般の意識に浸透する前、一般の人々と ai との直感的なつながりは主にゲームから始まった可能性があります。
ai はビデオゲームの歴史において私たちが思っているよりもはるかに重要です
多くの人は、ai トレインに乗り出した最初のゲームの 1 つが古典的なアーケード ゲーム「パックマン」になるとは思っていなかったかもしれません。
プレイヤーの勝利の前提条件は、迷路内の豆をすべて食べることです。一見ばかばかしいカラフルな幽霊はさまざまな追跡アルゴリズムを備えており、さまざまな経路や方法でプレイヤーを追跡します。
各ゴーストのアルゴリズムの動きは非常に単純で、プレイヤーがこれらのルールを理解すると、ゲームの難易度は大幅に下がります。
1987 年に発売された「メタルギア ソリッド」は、ゲーム ai における新たな重要なマイルストーンとなりました。
ゲーム内の ai キャラクターはより複雑な行動パターンを示すようになり、初めてプレイヤーに対する敵対的な反応メカニズムが導入されました。プレイヤーが敵に発見されると、敵は警報システムを作動させ、増援を要請し、巡回ルートを変更し、さらには罠を仕掛けます。
後ほど、aiとゲームの発展過程を一連の画期的な出来事として簡単に列挙すると、おおよそ次のようになる。

1997 年、ibm の「ディープ ブルー」がチェスの試合で人間の世界チャンピオンを破り、チェス ゲームにおける ai の大きな進歩となりました。

2004 年に「half-life 2」がリリースされ、ゲーム内の ai キャラクターはより複雑な意思決定と対話を行うことができるようになり、ゲームへの没入感が向上しました。

2011 年、ai の自然言語処理と知識推論の進歩を実証するクイズ番組「jeopardy!」で、ibm の「ワトソン」が人間のチャンピオンを破りました。

2016 年、alphago は囲碁ゲームでイ セドルを破り、複雑な戦略ゲームにおける ai の大きな進歩を記録しました。

2018 年には、「レッド デッド リデンプション 2」がリリースされ、ゲームの ai キャラクターと環境の間のインタラクションのレベルが大幅に向上し、非常にリアルなゲーム体験が提供されました。

2020 年、nvidia は、ai を使用してグラフィックスのレンダリングを高速化し、ゲームのパフォーマンスと画質を向上させる dlss テクノロジーを発表しました。
現在のゲーム環境を見ると、ゲームは依然として仲間関係に重点を置いており、ai はその仲間関係を無数に増幅するアンプのようなものです。
今年の ces ショーで、nvidia は avatar cloud engine (ace) を使用してゲームの npc を「生きた」ものにし、業界で人気を博しました。
kairos と呼ばれるデモでは、プレイヤーはラーメン店のオーナーであるジンと対話することができました。ジンは単なる npc ですが、生成 ai の助けを借りて、本物の人間のように質問に答えます。
ai とゲームの組み合わせは常に愛憎の組み合わせです。
対戦型ゲームを例に挙げると、以前は単に難易度を厳格に調整するだけでしたが、現在は人間の操作を模倣してゲーム体験をよりリアルにしています。
サポーターは、人間をシミュレートした ai が対戦相手またはチームメイトになると、実際のプレイヤーがいないため、ゲームの競争感がさらに高まる可能性があると考えています。
これはプレイヤーの定着率が向上したというデメリットでもありますが、システムの制御下ではプレイヤーはaiによるプレイの渦から逃れることができません。
序盤には大胆な言葉があり、中盤にはナンセンスがあり、後半には沈黙があった。
次のゲームに勝つためだけに徹夜をしていると、自分がゲームをプレイしているのか、ゲームが私たちをプレイしているのかわかりにくくなります。
特にチームメイトが ai かもしれないと気づいたときの無力感は、綿を拳で叩くようなものです。私の心は柔らかくなり、集中力がなくなりました。
黄老預言者!将来のゲームはaiによって生成されるのでしょうか?
コーディングの初心者でも、ai を使用してゲームをプレイできます。
数年前なら、これはおそらく夢見ることしかできなかったでしょう。しかし、生成 ai の登場により、これらすべてが実現する余地が与えられました。
小さな規模では、gpt を作成してストーリーテリングをするようなものです。大きな規模では、ai 支援のミニプログラム ゲームです。ただし、インタラクティブ性はそれほど面白くありませんが、美しいグラフィックよりは優れています。
さらに一歩進めて、将来的には 3a の名作レベルのゲームも ai レンダリングによって直接生成される可能性があります。
昨年、nvidia の創設者ジェンスン フアンは、将来のゲームではすべてのピクセルがレンダリングではなく生成されると予測しました。当時これを言ったとき、皆さんはまだ躊躇しているかもしれません。
通常、環境の作成には、設計の複雑さに応じて、小規模なゲームの場合は 1 週間、スタジオ プロジェクトの場合はさらに長くかかることがあります。
先月、google deepmind は初の「ai ゲーム エンジン」gamengen を発表しました。
古典的なシューティング ゲーム「doom」を 1 つの tpu チップ上で毎秒 20 フレーム以上の速度でリアルタイムにシミュレートできます。
これは、拡散モデルを使用して各フレームをリアルタイムで予測することで機能します。つまり、ゲーム内のあらゆる瞬間が、プレイヤーのアクションと環境の複雑な相互作用に基づいてリアルタイムで生成されます。
当時、nvidia のシニアサイエンティストであるジム・ファン氏は、各地のハッカーによって乱暴に実行されていた「doom」が、実は純粋な拡散モデルで実装されており、あらゆるピクセルが生成されていたことにため息をつかずにはいられませんでした。
その後、さらに同様の結果が明らかになりました。
少し前に、tencent も大きな動きを見せ、aaa オープンワールド ゲームに特化した大型モデル gamegen-o を発売しました。
gamegen-o は、「the witcher 3」、「cyber​​punk 2077」、「assassin's creed」、「black myth: wukong」などのさまざまな aaa ゲームのキャラクター、ダイナミックな環境、複雑なアクション、および生成されたゲームの品質をシミュレートできます。ゲームシーンも非常に高いです。
データセットを構築するために、tencent は多額の費用を投じて 32,000 以上のゲームビデオを収集しました。各ビデオは短いもので数分、長いもので数時間あり、その後手動で利用可能な 15,000 のビデオを選択しました。データの注釈。
これらの厳選されたビデオは、シーン検出によってセグメントに分割され、美学、オプティカル フロー分析、およびセマンティック コンテンツに基づいて厳密に分類およびフィルタリングされます。
アメリカのゲーム開発会社エレクトロニック・アーツは最近、「想像力から創造へ」ビデオを通じて、ゲーム開発における ai の明るい未来を業界に示しました。
ビデオでは、プレイヤーは ai ツールを使用して、簡単な指示だけでゲームシーン、キャラクター、その他のコンテンツを作成できます。
ceoのアンドリュー・ウィルソン氏は、生成aiは将来的に同社の開発プロセスの半分以上を改善できる可能性があり、3~5年以内に、より大規模でより没入型のゲーム世界を設計、作成できるようになるだろうと述べた。
ai は既存のゲームの開発効率を向上させるだけでなく、新しいゲーム体験を生み出す可能性もあります。
おそらく、ゲームでどのような高度なテクノロジーが使用されているとしても、最終的には楽しさが一番大切だと言うかもしれません。
しかし、 gta 6. チェックが何度も遅れて痕跡が見つからない場合、衣食を足りるために自分たちでやろうという考えも出てくるかもしれません。
だって、自分の手で「シン・シティ」を構築できたら、かなり気持ちいいでしょうね。