Home » Esta IA consegue “apanhá-los todos” em batalhas Pokemon tão bem como os humanos

Esta IA consegue “apanhá-los todos” em batalhas Pokemon tão bem como os humanos

by Thomas

Quer apanhá-los a todos? Existe uma IA para isso. Apresentamos o POKE’LLMON, um novo agente de IA baseado em LLM, concebido para jogar batalhas Pokémon com uma proficiência semelhante à dos humanos.

O POKE’LLMON é uma criação de investigadores do Instituto de Tecnologia da Geórgia, que afirmam que utiliza a aprendizagem por reforço em contexto e a geração de conhecimento aumentado para aprender com as suas experiências de jogo e tomar decisões com uma precisão notável.

O modelo é tão bom que, de facto, conseguiu taxas de vitória notáveis contra jogadores humanos reais em batalhas Pokemon.

Pokemon AI?

Os investigadores de IA da universidade propuseram-se desenvolver um agente de IA de vanguarda – uma personagem alimentada por um modelo de IA que joga o jogo e aprende com ele, espelhando a aprendizagem humana e os processos de tomada de decisão. Ao contrário da abordagem tradicional, em que um jogador controlado por uma máquina seguiria regras pré-programadas, os seus criadores afirmam que o seu modelo de IA evolui, experimenta coisas novas e comporta-se mais como um jogador humano do que como um algoritmo.

Foi também concebido para funcionar noutros campos de batalha virtuais.

“É o primeiro agente incorporado no LLM que atinge o desempenho da paridade humana em jogos de batalha tática, como demonstrado nas batalhas Pokemon”, escreveu a equipa de investigação. “A arquitetura do POKE’LLMON é geral e pode ser adaptada para a conceção de agentes incorporados LLM em muitos outros jogos. “

Imagem: Georgia Institute of Technology

Imagem: Georgia Institute of Technology


O núcleo da proeza do POKE’LLMON reside no seu mecanismo avançado de aprendizagem por reforço em contexto, que evolui efetivamente à medida que ganha e perde batalhas, tornando-se cada vez mais hábil a prever e a contrariar os movimentos dos adversários.

Complementando a sua capacidade de aprendizagem, o POKE’LLMON também aplica aquilo a que os seus criadores chamam uma técnica de geração de conhecimento aumentado. Esta abordagem permite que a IA integre conhecimentos externos e verificados no seu processo de tomada de decisões, garantindo uma elevada precisão e escolhas contextualmente relevantes durante as batalhas.

Esta estratégia é especialmente útil para contrariar potenciais alucinações – um desafio comum nos sistemas de IA. Tal como implementado, a jogabilidade do POKE’LLMON é simultaneamente criativa e baseada em informações sólidas e específicas do jogo.

Os criadores também se certificaram de que o POKE’LLMON não é uma violeta encolhida. O modelo aplica uma técnica de geração de acções consistente para garantir que se mantém composto e estrategicamente consistente, mesmo quando enfrenta adversários formidáveis. Este aspeto da implementação da IA evita as decisões de pânico que afectam os concorrentes humanos.

“A geração de acções condicionada por pensamentos de pânico leva o agente a trocar continuamente de Pokemon em vez de atacar”, observam os investigadores. “Em comparação, a geração de ações consistentes com SC (autoconsistência) diminui a taxa de troca contínua, gerando ações de forma independente várias vezes e votando na ação mais consistente. “

O desempenho da IA na arena é nada menos do que impressionante. Com uma taxa de vitória de 49% em “competições de escada” e uma taxa de vitória ainda mais notável de 56% em batalhas convidadas, provou o seu valor contra um espetro de adversários, humanos ou não.

Não se deixe enganar pela vibração lúdica do Pokémon – existe um mundo de estratégia competitiva para explorar sob a sua superfície colorida. Pesquisas como a do POKE’LLMON podem servir de trampolim para novos modelos que impulsionam novos jogos.

O jogo comparável mais próximo é provavelmente o xadrez, e os sites de xadrez online detectam os batoteiros com base nas suas jogadas e na probabilidade de executar um ataque em comparação com o que um humano pode ou quer fazer. Os algoritmos informáticos estão configurados para executar sempre a melhor jogada, o que lhes dá – ou às pessoas que os utilizam – uma vantagem distinta.

No entanto, com uma IA adaptável e semelhante à humana, estas ferramentas de batota poderão em breve tornar-se obsoletas, tornando as batalhas entre humanos e máquinas mais divertidas e desafiantes.

Related Posts

Leave a Comment