Хитрун! Штучний інтелект навчився обманювати, щоб перемагати людей у військовій грі Stratego

8 грудня 2022, 16:17
Stratego — гра із величезною кількістю можливих ходів (Фото:boardgamehalv)

Stratego — гра із величезною кількістю можливих ходів (Фото:boardgamehalv)

Компанія DeepMind створила штучний інтелект DeepNash, який переміг у 97% партій проти інших моделей та у 84% партій проти найкращих гравців-людей.

У людства потроху закінчуються ігри, в яких ми можемо називате себе лідерами — штучний інтелект (ШІ) вже перемагає більшість людей в покер, шахи, го та гру Diplomacy. Тепер до цього списку можна додати військову настолку Stratego.

Відео дня

У кожного з гравців є по 40 фігурок, розташування яких відкрито лише гравцю, який ними управляє. Фігурки пересуваться по клітинках на спеціальній дошці, а мета — захопити «прапор» суперника або загнати його у ситуацію, коли у нього не залишається ходів.

Ця гра розрахована на двох учасників. Дослідники називають її набагато важчою для ШІ, ніж покер, го чи шахи, оскільки у Stratego може бути 10535 різних станів, порівняно, наприклад, з 10360 у Go, яка відома якраз великою кількістю можливих варіантів розвитку гри. Крім того, у Stratego є 1066 стартових позицій — у двох гравців техаського холдему є лише 106 стартових ситуацій, пише Nature.

ШІ під назвою DeepNash виграв майже всі матчі, в яких він грав проти інших нейромереж. Також він вигравав трохи більше 8 з 10 ігор проти людей. DeepNash навчався, граючи сам з собою, а згодом почав ухвалювати складні рішення і йти на «незвичні» компроміси, на які були нездатні попередні системи ШІ.

Заради перемоги DeepNash балансував між довгостроковою стратегією та несподіваними рішеннями, які включали в себе ризик та блеф. Дослідники зазначають, що раніше жоден ШІ не міг поєднувати ці два підходи, що й дало DeepNash таку перевагу.

«Наскільки нам відомо, це перший раз, коли алгоритм ШІ зміг навчитися грати в Stratego на рівні людини-експерта», — заявляють дослідники.

Показати ще новини
Радіо NV
X