Home » Deze AI kan ze allemaal vangen in Pokemongevechten, net zo goed als mensen.

Deze AI kan ze allemaal vangen in Pokemongevechten, net zo goed als mensen.

by Tim

Wil je ze allemaal vangen? Daar is een AI voor. Maak kennis met POKE´LLMON, een nieuwe op LLM gebaseerde AI-agent die is ontworpen om Pokémon-gevechten te spelen met een menselijke vaardigheid.

POKE´LLMON is het geesteskind van onderzoekers van het Georgia Institute of Technology, die zeggen dat het in-context reinforcement learning en knowledge-augmented generation gebruikt om te leren van zijn spelervaringen en beslissingen neemt met een opmerkelijke nauwkeurigheid.

Het model is zelfs zo goed dat het opmerkelijke winstpercentages heeft behaald tegen echte menselijke spelers in Pokemongevechten.

Pokemon AI?

De AI-onderzoekers van de universiteit wilden een geavanceerde AI-agent ontwikkelen – een personage dat wordt aangedreven door een AI-model dat het spel speelt en ervan leert, en zo menselijke leer- en besluitvormingsprocessen weerspiegelt. In tegenstelling tot de oude aanpak, waarbij een machinegestuurde speler voorgeprogrammeerde regels volgt, zeggen de ontwikkelaars dat hun AI-model evolueert, nieuwe dingen probeert en zich meer gedraagt als een menselijke speler dan als een algoritme.

Het is ook ontworpen om op andere virtuele slagvelden te werken.

“[Het is] de eerste LLM belichaamde agent die prestaties van mens-pariteit bereikt in tactische gevechtsspellen, zoals gedemonstreerd in Pokemon gevechten,” schreef het onderzoeksteam. “De architectuur van POKE´LLMON is algemeen en kan worden aangepast voor het ontwerp van LLM-embodied agents in veel andere games.”

Afbeelding: Georgia Institute of Technology

Afbeelding: Georgia Institute of Technology


De kern van de kracht van POKE´LLMON ligt in het geavanceerde in-context mechanisme voor versterkingsleren, dat effectief evolueert naarmate het gevechten wint en verliest, en steeds beter wordt in het voorspellen en counteren van zetten van tegenstanders.

Als aanvulling op zijn leervermogen past POKE´LLMON ook wat de makers noemen een kennisverrijkende generatietechniek toe. Met deze aanpak kan de AI externe, geverifieerde kennis integreren in zijn besluitvormingsproces, wat zorgt voor hoge nauwkeurigheid en contextueel relevante keuzes tijdens gevechten.

Deze strategie is vooral nuttig bij het tegengaan van mogelijke hallucinaties – een veelvoorkomende uitdaging bij AI-systemen. De geïmplementeerde gameplay van POKE´LLMON is zowel creatief als gebaseerd op solide, spelspecifieke informatie.

De ontwikkelaars hebben er ook voor gezorgd dat POKE´LLMON geen krimpkous is. Het model gebruikt een consistente techniek voor het genereren van acties om ervoor te zorgen dat het kalm en strategisch consistent blijft, zelfs als het tegenover geduchte tegenstanders staat. Dit aspect van de AI-implementatie voorkomt de paniekerige beslissingen die menselijke tegenstanders plagen.

“Het genereren van acties op basis van paniekgedachten leidt ertoe dat de agent voortdurend van Pokemons wisselt in plaats van aan te vallen”, aldus de onderzoekers. “Ter vergelijking, consistente actiegeneratie met SC (self-consistency) vermindert de continue switchratio door onafhankelijk meerdere keren acties te genereren en de meest consistente actie eruit te stemmen.”

De prestaties van de AI in de arena zijn ronduit indrukwekkend. Met een winstpercentage van 49% in “laddercompetities” en een nog opmerkelijker winstpercentage van 56% in uitgenodigde gevechten, heeft de AI zijn kwaliteiten bewezen tegen een breed scala aan uitdagers, zowel menselijke als niet-menselijke.

Laat je niet misleiden door de speelse sfeer van Pokémon – onder het kleurrijke oppervlak schuilt een wereld van competitieve strategie. Onderzoek zoals POKE´LLMON kan dienen als springplank voor nieuwe modellen die nieuwe spellen aandrijven.

Het dichtstbijzijnde vergelijkbare spel is waarschijnlijk schaken, en online schaaksites detecteren valsspelers op basis van hun zetten en de waarschijnlijkheid van het uitvoeren van een aanval in vergelijking met wat een mens kan of zou doen. Computeralgoritmes zijn geconfigureerd om elke keer de beste zet uit te voeren, wat hen – of mensen die ze gebruiken – een duidelijk voordeel geeft.

Met aanpasbare, mensachtige AI kunnen deze hulpmiddelen om vals te spelen echter binnenkort overbodig worden, waardoor gevechten tussen mens en machine leuker en uitdagender worden.

Related Posts

Leave a Comment