Home » Този изкуствен интелект може да “хване всички” в битките с покемони, както и хората

Този изкуствен интелект може да „хване всички“ в битките с покемони, както и хората

by Patricia

Искате ли да ги хванете всички? Има изкуствен интелект за това. Представяме ви POKE´LLMON – нов агент на ИИ, базиран на LLM, предназначен да играе битки с покемони с умение, подобно на това на хората.

POKE´LLMON е дело на изследователи от Технологичния институт на Джорджия, които твърдят, че той използва контекстуално усилване на обучението и разширено генериране на знания, за да се учи от своя игрови опит и да взема решения със забележителна точност.

Моделът е толкова добър, че в действителност е постигнал забележителни резултати в битките с покемони срещу реални играчи.

Покемон AI?

Университетските изследователи на изкуствения интелект си поставят за цел да разработят авангарден агент на изкуствения интелект – личност, задвижвана от модел на изкуствения интелект, който едновременно играе играта и се учи от нея, отразявайки човешките процеси на учене и вземане на решения. За разлика от досегашния подход, при който контролираният от машина играч следва предварително програмирани правила, разработчиците казват, че техният AI модел се развива, опитва нови неща и се държи по-скоро като човешки играч, отколкото като алгоритъм.

Той е проектиран да работи и на други виртуални бойни полета.

„[Това е] първият въплътен в LLM агент, който постига ефективност, близка до тази на човека, в тактически бойни игри, както е демонстрирано в битките с покемони“, пише изследователският екип. „Архитектурата на POKE´LLMON е обща и може да бъде адаптирана за проектиране на въплътени в LLM агенти в много други игри.“

Изображение: Georgia Institute of Technology

Изображение: Georgia Institute of Technology


Сърцевината на уменията на POKE´LLMON се крие в усъвършенствания механизъм за учене чрез подсилване в контекста, който ефективно се развива, докато печели и губи битки, като става все по-умел в предвиждането и противодействието на ходовете на противниците.

В допълнение към способността си за учене POKE´LLMON прилага и това, което създателите му наричат техника за генериране на разширени знания. Този подход позволява на изкуствения интелект да интегрира външни, проверени знания в процеса на вземане на решения, като гарантира висока точност и контекстуално подходящи решения по време на битките.

Тази стратегия е особено полезна за противодействие на потенциални халюцинации – често срещано предизвикателство при системите с изкуствен интелект. Така, както е реализиран, геймплеят на POKE´LLMON е едновременно креативен и основан на солидна, специфична за играта информация.

Разработчиците също така са се погрижили POKE´LLMON да не е свиваща се виолетова игра. Моделът прилага последователна техника за генериране на действия, за да гарантира, че остава сдържан и стратегически последователен, дори когато се изправя срещу могъщи противници. Този аспект от реализацията на изкуствения интелект предотвратява вземането на панически решения, което тормози човешките състезатели.

„Генерирането на действия, обусловено от панически мисли, води до това, че агентът непрекъснато сменя покемоните, вместо да атакува“, отбелязват изследователите. „За сравнение, последователното генериране на действия с SC (self-consistency) намалява съотношението на непрекъснатите превключвания чрез независимо генериране на действия многократно и гласуване на най-последователното действие.“

Постиженията на изкуствения интелект на арената са впечатляващи. С 49% успеваемост в „състезания по стълби“ и още по-забележителна 56% успеваемост в поканени битки, той е доказал своите качества срещу спектър от претенденти, както човешки, така и нечовешки.

Не позволявайте на игривата атмосфера на Pokémon да ви заблуди – под нейната цветна повърхност се крие свят на състезателна стратегия, който трябва да бъде изследван. Изследвания като POKE´LLMON могат да послужат като отправна точка за нови модели, които да задвижат нови игри.

Най-близката сравнима игра вероятно е шахматът, а онлайн сайтовете за шахмат откриват измамници въз основа на техните ходове и вероятността за изпълнение на атака в сравнение с това, което може или би направил човек. Компютърните алгоритми са конфигурирани така, че всеки път да изпълняват най-добрия ход, което им дава – или на хората, които ги използват – явно предимство.

С адаптивния, подобен на човешкия изкуствен интелект обаче тези инструменти за измама скоро може да се окажат излишни, което ще направи битките човек срещу машина по-забавни и предизвикателни.

Related Posts

Leave a Comment