Home » Esta IA puede “atraparlos a todos” en batallas Pokemon tan bien como los humanos

Esta IA puede «atraparlos a todos» en batallas Pokemon tan bien como los humanos

by Thomas

¿Quieres atraparlos a todos? Hay una IA para eso. Presentamos POKE’LLMON, un nuevo agente de IA basado en LLM y diseñado para jugar batallas Pokémon con una destreza similar a la humana.

POKE’LLMON es una creación de los investigadores del Instituto de Tecnología de Georgia, que afirman que utiliza el aprendizaje por refuerzo en contexto y la generación de conocimiento aumentado para aprender de sus experiencias de juego y toma decisiones con una precisión notable.

De hecho, el modelo es tan bueno que ha obtenido notables victorias contra jugadores humanos reales en batallas Pokemon.

¿La IA de Pokemon?

Los investigadores universitarios de IA se propusieron desarrollar un agente de IA de vanguardia: un personaje impulsado por un modelo de IA que juega y aprende del juego, reflejando los procesos humanos de aprendizaje y toma de decisiones. A diferencia del enfoque tradicional, en el que un jugador controlado por una máquina seguiría reglas preprogramadas, sus creadores afirman que su modelo de IA evoluciona, prueba cosas nuevas y se comporta más como un jugador humano que como un algoritmo.

También está diseñado para funcionar en otros campos de batalla virtuales.

«Es] el primer agente encarnado LLM que alcanza un rendimiento similar al humano en juegos de batallas tácticas, como se demostró en las batallas Pokemon», escribió el equipo de investigación. «La arquitectura de POKE’LLMON es general y puede adaptarse para el diseño de agentes con LLM en muchos otros juegos».

Imagen: Georgia Institute of Technology

Imagen: Georgia Institute of Technology


El núcleo de la proeza de POKE’LLMON reside en su avanzado mecanismo de aprendizaje por refuerzo en contexto, que evoluciona eficazmente a medida que gana y pierde batallas, haciéndose cada vez más experto en predecir y contrarrestar los movimientos de sus oponentes.

Como complemento a su capacidad de aprendizaje, POKE’LLMON también aplica lo que sus creadores denominan una técnica de generación aumentada de conocimiento. Este enfoque permite a la IA integrar conocimientos externos y verificados en su proceso de toma de decisiones, garantizando una gran precisión y elecciones contextualmente relevantes durante las batallas.

Esta estrategia es especialmente útil para contrarrestar posibles alucinaciones, un reto habitual en los sistemas de IA. Tal y como está implementada, la jugabilidad de POKE’LLMON es a la vez creativa y se basa en información sólida y específica del juego.

Los desarrolladores también se han asegurado de que POKE’LLMON no sea un juego para encogerse de hombros. El modelo aplica una técnica de generación de acciones consistente para garantizar que mantiene la compostura y la coherencia estratégica, incluso cuando se enfrenta a oponentes formidables. Este aspecto de la implementación de la IA evita las decisiones impulsadas por el pánico que asolan a los competidores humanos.

«La generación de acciones condicionada por pensamientos de pánico lleva al agente a cambiar continuamente de Pokémon en lugar de atacar», señalan los investigadores. «En comparación, la generación de acciones consistentes con SC (autoconsistencia) disminuye el ratio de cambio continuo al generar acciones de forma independiente varias veces y votar la acción más consistente. «

El rendimiento de la IA en la arena es impresionante. Con un 49% de victorias en «competiciones de escalera» y un 56% aún más notable en batallas por invitación, ha demostrado su valía contra todo tipo de rivales, humanos o no.

No dejes que el ambiente lúdico de Pokémon te engañe: hay un mundo de estrategia competitiva que explorar bajo su colorida superficie. Investigaciones como POKE’LLMON podrían servir de trampolín para nuevos modelos que impulsen nuevos juegos.

El juego comparable más cercano probablemente sea el ajedrez, y los sitios de ajedrez en línea detectan a los tramposos basándose en sus movimientos y en la probabilidad de ejecutar un ataque frente a lo que puede o haría un humano. Los algoritmos informáticos están configurados para ejecutar siempre la mejor jugada, lo que les confiere -o confiere a quienes los utilizan- una clara ventaja.

Sin embargo, con una IA adaptable y similar a la humana, estas herramientas para hacer trampas pronto podrían quedar obsoletas, haciendo que las batallas entre humanos y máquinas sean más divertidas y desafiantes.

Related Posts

Leave a Comment