Осторожно, манипулятор. Современные модели ИИ умеют обманывать людей — исследователи

26 мая 2024, 19:05

Автор: Анастасия Печенюк

Исследователи обнаружили, что многие популярные системы искусственного интеллекта уже способны обманывать людей. Пока эту способность они проявляют в основном в играх, но ситуация может измениться.

Группа ученых проанализировала, как системы искусственного интеллекта подпитывают и распространяют дезинформацию, используя «обученный обман». Как говорится в статье, опубликованной 10 мая в журнале Patterns, исследователи обнаружили этот обученный обман в программном обеспечении CICERO, системе искусственного интеллекта, разработанной Meta для игры в популярную стратегическую настольную игру на военную тематику Diplomacy. В игру обычно играют до семи человек, которые заключают и разрывают военные соглашения за годы до Первой мировой войны.

Хотя Meta научила CICERO быть «в основном честным и полезным» и не предавать своих человеческих союзников, исследователи обнаружили, что CICERO был нечестным и нелояльным. Они описывают систему искусственного интеллекта как «экспертного лжеца», который предал своих товарищей и совершил действия «преднамеренного обмана», создав заранее спланированные сомнительные альянсы, которые ввели в заблуждение игроков и оставили их открытыми для нападения со стороны врагов.

«Мы обнаружили, что искусственный интеллект Meta научился быть мастером обмана. Хотя Meta удалось научить свой искусственный интеллект побеждать в игре дипломатии — CICERO попал в 10% лучших игроков-людей, которые играли более одной игры — Meta не смогла научить свой искусственный интеллект побеждать честно», — сказал в комментарии Science Daily Питер С. Парк, докторант Массачусетском технологическом институте (MIT), участвовавший в исследовании.

Они также нашли доказательства обученного обмана в другой игровой системе Meta, Pluribus. Покерный бот с искусственным интеллектом может блефовать и убеждать игроков сбросить карты. Другой инструмент, AlphaStar от DeepMind — разработанный, чтобы добиться успеха в стратегической видеоигре Starcraft II — обманул своих оппонентов, имитируя передвижение войск и тайно планируя различные атаки.

Но кроме мошенничества в играх, исследователи нашли типы обмана ИИ, которые потенциально могут дестабилизировать общество. Например, системы искусственного интеллекта получили преимущество в экономических переговорах, искажая свои истинные намерения. Другие агенты искусственного интеллекта притворились мертвыми, чтобы обмануть тест на безопасность, направленный на выявление и искоренение быстро воспроизводящихся форм ИИ.

Исследователь Парк предупредил, что враждующие страны могут использовать эту технологию для фальсификации и вмешательства в выборы. Если эти системы будут продолжать увеличивать свои обманчивые и манипулятивные возможности в течение следующих лет и десятилетий, люди могут не иметь возможности контролировать их долго, убежден он.

Войти