Home » このAIはポケモンバトルで人間と同じように「全部捕まえる」ことができる

このAIはポケモンバトルで人間と同じように「全部捕まえる」ことができる

by v

全員捕まえたい?そのためのAIがある。POKE´LLMONを紹介しよう。LLMベースの新しいAIエージェントで、人間のような熟練度でポケモンバトルをプレイできるように設計されている。

POKE´LLMONはジョージア工科大学の研究者の発案によるもので、コンテキスト内強化学習と知識補強世代を用いてゲームプレイの経験から学習し、驚くべき正確さで判断を下すという。

このモデルは非常に優秀で、実際、ポケモンバトルで実際の人間プレイヤーに顕著な勝率を記録している

ポケモンAI?

大学のAI研究者たちは、最先端のAIエージェントの開発に着手した。このAIエージェントは、人間の学習と意思決定のプロセスを反映し、ゲームをプレイすると同時に、ゲームから学習するAIモデルを搭載したペルソナである。機械制御のプレーヤーがあらかじめプログラムされたルールに従う従来のアプローチとは異なり、このAIモデルは進化し、新しいことに挑戦し、アルゴリズムというより人間のプレーヤーに近い振る舞いをすると開発者は言う。

また、他の仮想戦場でも機能するように設計されている。

「ポケモンバトルで実証されたように、戦術的バトルゲームにおいて人間と同等のパフォーマンスを達成した最初のLLM具現化エージェントです」と研究チームは書いている。「POKE´LLMONのアーキテクチャは一般的であり、他の多くのゲームにおけるLLM具現化エージェントの設計に適応できる」


Image: ジョージア工科大学

Image: ジョージア工科大学


POKE´LLMONの実力の核心は、その高度な文脈内強化学習メカニズムにある。このメカニズムは、バトルに勝ったり負けたりしながら効果的に進化し、相手の動きを予測して対抗することにますます習熟していく。

その学習能力を補完するために、POKE´LLMONは、クリエイターが「知識拡張型生成技術」と呼ぶ手法も適用している。この手法により、AIは外部で検証された知識を意思決定プロセスに統合することができ、バトル中に高い精度と状況に応じた適切な選択を行うことができる。

この戦略は、AIシステムで一般的な課題である潜在的な幻覚への対策に特に役立つ。実装されたPOKE´LLMONのゲームプレイは、独創的であると同時に、ゲームに特化した確かな情報に基づいている。

開発者はまた、POKE´LLMONが縮こまったバイオレットではないことも確認した。このモデルには一貫したアクション生成技術が適用されており、手ごわい相手と対戦しても、落ち着いて戦略的に一貫性を保てるようになっている。このAI実装の側面は、人間の競技者を悩ませるパニック的な決定を防ぐ。

「パニック思考を条件とした行動生成では、エージェントは攻撃せずにポケモンを交代させ続けることになる」と研究者たちは指摘する。「これに対し、SC(自己一貫性)を用いた一貫性のある行動生成は、独立して複数回行動を生成し、最も一貫性のある行動を投票することで、連続的な切り替え率を低下させる。

闘技場におけるAIのパフォーマンスは見事としか言いようがない。ラダー戦」での勝率は49%、「招待戦」での勝率は56%と、人間・非人を問わず、さまざまな挑戦者を相手にその実力を証明している。

ポケモンの遊び心に惑わされてはいけない。そのカラフルな表面の下には、競争戦略の世界が広がっているのだ。POKE´LLMONのような研究は、新しいゲームを生み出す新しいモデルの足がかりになるかもしれない。

最も近い類似ゲームはおそらくチェスであり、オンライン・チェス・サイトでは、その手と、人間ができること、あるいはするであろうことに対して攻撃を実行する確率に基づいて、イカサマ師を検出している。コンピュータのアルゴリズムは、常に最善の手を実行するように設定されているため、彼ら、あるいは彼らを利用する人間には明確な優位性がある。

しかし、順応性のある人間のようなAIを使えば、このようなイカサマのツールはすぐに時代遅れになり、人間対機械の戦いがより楽しく、やりがいのあるものになるかもしれない

Related Posts

Leave a Comment