Home » Этот искусственный интеллект может “поймать их всех” в битвах с покемонами не хуже человека

Этот искусственный интеллект может «поймать их всех» в битвах с покемонами не хуже человека

by v

Хотите поймать их всех? Для этого есть искусственный интеллект. Представляем POKE´LLMON, новый ИИ-агент на базе LLM, созданный для того, чтобы играть в битвы с покемонами с человекоподобным мастерством.

POKE´LLMON — детище исследователей из Технологического института Джорджии, которые утверждают, что он использует контекстное обучение с подкреплением и генерацию знаний, чтобы учиться на своем игровом опыте и принимать решения с поразительной точностью.

Модель настолько хороша, что в сражениях с покемонами она одерживает значительные победы над реальными игроками-людьми.

Искусственный интеллект покемонов?

Исследователи университетского ИИ поставили перед собой задачу разработать передового ИИ-агента — персону, управляемую ИИ-моделью, которая одновременно играет в игру и учится в ней, зеркально отражая процессы обучения и принятия решений человеком. В отличие от традиционного подхода, при котором игрок, управляемый машиной, следует заранее запрограммированным правилам, разработчики утверждают, что их модель ИИ развивается, пробует новое и ведет себя скорее как человеческий игрок, чем как алгоритм.

Она также рассчитана на работу на других виртуальных полях сражений.

«[Это] первый воплощенный агент LLM, который достигает производительности, равной человеческой, в тактических играх, что было продемонстрировано в сражениях с покемонами», — пишет исследовательская группа. «Архитектура POKE´LLMON является общей и может быть адаптирована для разработки LLM-воплощенных агентов во многих других играх. «

Изображение: Georgia Institute of Technology

Изображение: Georgia Institute of Technology


В основе мастерства POKE´LLMON лежит его продвинутый механизм контекстного обучения с подкреплением, который эффективно развивается по мере побед и поражений, становясь все более искусным в предсказании и парировании ходов противников.

В дополнение к способности к обучению POKE´LLMON также применяет то, что его создатели называют техникой генерации знаний с дополнением. Этот подход позволяет ИИ интегрировать внешние, проверенные знания в процесс принятия решений, обеспечивая высокую точность и контекстуальность выбора во время сражений.

Эта стратегия особенно полезна для борьбы с возможными галлюцинациями — распространенной проблемой систем ИИ. В результате геймплей POKE´LLMON получился одновременно и креативным, и основанным на достоверной, специфической для игры информации.

Разработчики также позаботились о том, чтобы POKE´LLMON не была «фиалкой». Модель применяет технику последовательного генерирования действий, что позволяет ей оставаться сдержанной и стратегически последовательной даже при столкновении с грозными противниками. Этот аспект реализации ИИ предотвращает принятие панических решений, от которых страдают человеческие соперники.

«Генерация действий, обусловленная паническими мыслями, приводит к тому, что агент постоянно меняет покемонов вместо того, чтобы атаковать», — отмечают исследователи. «По сравнению с этим, последовательная генерация действий с SC (самосогласованность) уменьшает коэффициент непрерывного переключения, независимо генерируя действия несколько раз и голосуя за наиболее последовательное действие. «

Результаты работы ИИ на арене просто впечатляют. С показателем 49 % побед в «лестничных соревнованиях» и еще более впечатляющим показателем 56 % побед в приглашенных боях он доказал свою состоятельность в борьбе с самыми разными соперниками, как людьми, так и нелюдьми.

Не позволяйте игривой атмосфере Pokémon обмануть вас — под ее красочной поверхностью скрывается целый мир соревновательной стратегии. Исследования, подобные POKE´LLMON, могут послужить ступенькой для создания новых моделей, которые станут основой для новых игр.

Ближайшая сопоставимая игра — это, вероятно, шахматы, а шахматные сайты в Интернете выявляют мошенников, основываясь на их ходах и вероятности выполнения атаки по сравнению с тем, что может или мог бы сделать человек. Компьютерные алгоритмы настроены на выполнение лучшего хода каждый раз, что дает им — или людям, которые их используют, — явное преимущество.

Однако с появлением адаптируемого человекоподобного ИИ эти инструменты мошенничества могут вскоре выйти из употребления, сделав сражения человека с машиной более увлекательными и сложными.

Related Posts

Leave a Comment