Home » Ta sztuczna inteligencja może “złapać je wszystkie” w bitwach Pokemon tak samo jak ludzie

Ta sztuczna inteligencja może „złapać je wszystkie” w bitwach Pokemon tak samo jak ludzie

by Thomas

Chcesz złapać je wszystkie? Jest na to sztuczna inteligencja. Przedstawiamy POKE´LLMON, nowego agenta AI opartego na LLM, zaprojektowanego do rozgrywania bitew Pokémon z biegłością podobną do ludzkiej.

POKE´LLMON jest pomysłem naukowców z Georgia Institute of Technology, którzy twierdzą, że wykorzystuje uczenie się ze wzmocnieniem w kontekście i generowanie wiedzy, aby uczyć się na podstawie swoich doświadczeń z gry i podejmować decyzje z niezwykłą dokładnością.

W rzeczywistości model jest tak dobry, że odnotował znaczące wskaźniki wygranych z prawdziwymi ludzkimi graczami w bitwach Pokemon.

Pokemon AI?

Badacze uniwersyteccy zajmujący się sztuczną inteligencją postanowili opracować najnowocześniejszego agenta sztucznej inteligencji – osobowość zasilaną przez model sztucznej inteligencji, który zarówno gra w grę, jak i uczy się z niej, odzwierciedlając ludzkie procesy uczenia się i podejmowania decyzji. W przeciwieństwie do starszego podejścia, w którym gracz sterowany maszynowo postępowałby zgodnie z zaprogramowanymi zasadami, jego twórcy twierdzą, że ich model sztucznej inteligencji ewoluuje, próbuje nowych rzeczy i zachowuje się bardziej jak ludzki gracz niż algorytm.

Został on również zaprojektowany do pracy na innych wirtualnych polach bitew.

„[To] pierwszy ucieleśniony agent LLM, który osiąga wydajność równą ludzkiej w taktycznych grach bitewnych, jak pokazano w bitwach Pokemonów” – napisał zespół badawczy. „Architektura POKE´LLMON jest ogólna i może być dostosowana do projektowania agentów LLM w wielu innych grach.”

Image: Georgia Institute of Technology

Image: Georgia Institute of Technology


Rdzeń umiejętności POKE´LLMON leży w jego zaawansowanym mechanizmie uczenia się ze wzmocnieniem w kontekście, który skutecznie ewoluuje w miarę wygrywania i przegrywania bitew, stając się coraz bardziej biegły w przewidywaniu i przeciwdziałaniu ruchom przeciwników.

Uzupełniając swoją zdolność uczenia się, POKE´LLMON stosuje również to, co jego twórcy nazywają techniką generowania wiedzy. Podejście to pozwala sztucznej inteligencji zintegrować zewnętrzną, zweryfikowaną wiedzę z procesem podejmowania decyzji, zapewniając wysoką dokładność i kontekstowe wybory podczas bitew.

Strategia ta jest szczególnie pomocna w przeciwdziałaniu potencjalnym halucynacjom – powszechnemu wyzwaniu w systemach sztucznej inteligencji. Rozgrywka w POKE´LLMON jest zarówno kreatywna, jak i oparta na solidnych, specyficznych dla gry informacjach.

Deweloperzy upewnili się również, że POKE´LLMON nie jest kurczącym się fioletem. Model stosuje spójną technikę generowania akcji, aby zapewnić, że pozostaje opanowany i spójny strategicznie, nawet w obliczu potężnych przeciwników. Ten aspekt implementacji sztucznej inteligencji zapobiega podejmowaniu decyzji pod wpływem paniki, która nęka ludzkich konkurentów.

„Generowanie akcji uwarunkowane myślami paniki prowadzi agenta do ciągłego przełączania Pokemonów zamiast atakowania” – zauważają naukowcy. „Dla porównania, konsekwentne generowanie akcji z SC (samozgodność) zmniejsza współczynnik ciągłego przełączania poprzez niezależne wielokrotne generowanie akcji i głosowanie na najbardziej spójną akcję.”

Osiągi SI na arenie są po prostu imponujące. Z 49% współczynnikiem wygranych w „konkursach drabinkowych” i jeszcze bardziej niezwykłym 56% współczynnikiem wygranych w zaproszonych bitwach, udowodniła ona swoją skuteczność przeciwko szerokiemu spektrum przeciwników, zarówno ludzkich, jak i nie.

Nie daj się zwieść zabawnemu klimatowi Pokémon – pod jego kolorową powierzchnią kryje się świat strategii rywalizacji. Badania takie jak POKE´LLMON mogą służyć jako odskocznia dla nowych modeli, które napędzają nowe gry.

Najbliższą porównywalną grą są prawdopodobnie szachy, a internetowe strony szachowe wykrywają oszustów na podstawie ich ruchów i prawdopodobieństwa wykonania ataku w porównaniu z tym, co może lub zrobiłby człowiek. Algorytmy komputerowe są skonfigurowane tak, aby za każdym razem wykonywać najlepszy ruch, co daje im – lub ludziom, którzy z nich korzystają – wyraźną przewagę.

Jednak dzięki adaptowalnej, podobnej do ludzkiej sztucznej inteligencji, te narzędzia do oszukiwania mogą wkrótce stać się przestarzałe, czyniąc bitwy człowiek kontra maszyna bardziej zabawnymi i wymagającymi.

Related Posts

Leave a Comment