Home » Cette IA est capable d’attraper tous les Pokemon aussi bien que les humains.

Cette IA est capable d’attraper tous les Pokemon aussi bien que les humains.

by Tim

Vous voulez tous les attraper ? Il existe une IA pour cela. Voici POKE’LLMON, un nouvel agent IA basé sur LLM conçu pour jouer aux batailles de Pokémon avec une compétence comparable à celle des humains.

POKE’LLMON est le fruit du travail de chercheurs de l’Institut de technologie de Géorgie, qui affirment qu’il utilise l’apprentissage par renforcement en contexte et la génération augmentée de connaissances pour apprendre de ses expériences de jeu et prendre des décisions avec une précision remarquable.

Le modèle est si bon qu’il a remporté des victoires notables contre de vrais joueurs humains dans des combats de Pokemon.

Pokemon AI?

Les chercheurs en IA de l’université ont entrepris de mettre au point un agent d’IA de pointe, un personnage alimenté par un modèle d’IA qui joue au jeu et en tire des enseignements, reproduisant ainsi les processus d’apprentissage et de prise de décision de l’homme. Contrairement à l’approche traditionnelle, dans laquelle un joueur contrôlé par une machine suivrait des règles préprogrammées, les développeurs affirment que leur modèle d’IA évolue, essaie de nouvelles choses et se comporte davantage comme un joueur humain que comme un algorithme.

Il est également conçu pour fonctionner sur d’autres champs de bataille virtuels.

« C’est le premier agent incarné LLM qui atteint une performance de parité humaine dans les jeux de bataille tactique, comme démontré dans les batailles de Pokemon », a écrit l’équipe de recherche. « L’architecture de POKE’LLMON est générale et peut être adaptée à la conception d’agents incarnés LLM dans de nombreux autres jeux. « 

Image : Georgia Institute of Technology

Image : Georgia Institute of Technology


Le cœur des prouesses de POKE’LLMON réside dans son mécanisme avancé d’apprentissage par renforcement en contexte, qui évolue effectivement au fur et à mesure qu’il gagne et perd des batailles, devenant de plus en plus habile à prédire et à contrer les mouvements de ses adversaires.

En complément de sa capacité d’apprentissage, POKE’LLMON applique également ce que ses créateurs appellent une technique de génération augmentée de connaissances. Cette approche permet à l’IA d’intégrer des connaissances externes vérifiées dans son processus de prise de décision, garantissant ainsi une grande précision et des choix contextuels pertinents pendant les combats.

Cette stratégie est particulièrement utile pour contrer les hallucinations potentielles, un problème courant dans les systèmes d’IA. Tel qu’il est mis en œuvre, le gameplay de POKE’LLMON est à la fois créatif et fondé sur des informations solides et spécifiques au jeu.

Les développeurs ont également veillé à ce que POKE’LLMON ne soit pas un jeu de violettes. Le modèle applique une technique de génération d’actions cohérente pour s’assurer qu’il reste calme et stratégiquement cohérent, même lorsqu’il affronte des adversaires redoutables. Cet aspect de la mise en œuvre de l’IA permet d’éviter les décisions prises sous l’effet de la panique, comme c’est le cas pour les concurrents humains.

« La génération d’actions conditionnée par des pensées de panique conduit l’agent à changer continuellement de Pokemon au lieu d’attaquer », notent les chercheurs. « En comparaison, la génération d’actions cohérentes avec SC (self-consistency) diminue le ratio de changement continu en générant indépendamment des actions plusieurs fois et en votant pour l’action la plus cohérente. « 

Les performances de l’IA dans l’arène sont tout simplement impressionnantes. Avec un taux de victoire de 49 % dans les « compétitions d’échelle » et un taux de victoire encore plus remarquable de 56 % dans les batailles sur invitation, elle a fait ses preuves face à un large éventail de challengers, humains ou non.

Ne vous laissez pas tromper par l’ambiance ludique de Pokémon – il y a un monde de stratégie compétitive à explorer sous sa surface colorée. Des recherches telles que POKE’LLMON pourraient servir de tremplin à de nouveaux modèles qui alimenteraient de nouveaux jeux.

Le jeu comparable le plus proche est probablement le jeu d’échecs, et les sites d’échecs en ligne détectent les tricheurs en fonction de leurs mouvements et de la probabilité d’exécution d’une attaque par rapport à ce qu’un humain peut faire ou ferait. Les algorithmes informatiques sont configurés pour exécuter le meilleur mouvement à chaque fois, ce qui leur confère – ou aux personnes qui les utilisent – un avantage certain.

Toutefois, grâce à une IA adaptable et semblable à celle de l’homme, ces outils de triche pourraient bientôt devenir obsolètes, ce qui rendrait les batailles entre humains et machines plus amusantes et stimulantes.

Related Posts

Leave a Comment