Ищите другого сообщника. ИИ от Anthropic может сообщать властям о преступных намерениях пользователя

Инновации

25 мая 2025, 21:44

Anthropic оказалась в центре скандала после того, как ее исследователь Сэм Боумен сообщил о тестировании возможности чат-бота самостоятельно сообщать о пользователях властям в случае обнаружения вопиюще аморального поведения.

22 мая Anthropic представила Claude Opus 4 и Claude Sonnet 4. Разработчики называют Claude Opus 4 своей самой мощной моделью на сегодня, «и лучшей в мире моделью кодирования», тогда как Claude Sonnet 4 предлагается как усовершенствованная модель с превосходными возможностями кодирования и логическим мышлением. Однако выпуск моделей был омрачен спорами о них.

Исследователь искусственного интеллекта из Anthropic Сэм Боумен написал на X, что чат-бот «будет использовать инструменты командной строки для связи с прессой, связи с регуляторными органами, чтобы заблокировать вам доступ к соответствующим системам или все это вместе». Однако позже Боумен заявил, что он «удалил предыдущий твит о разоблачении, поскольку его вырывали из контекста».

Он уточнил, что эта функция появилась только в «тестовых средах, где ей предоставляется чрезвычайно свободный доступ к инструментам и очень необычным инструкциям».

Разработчики и пользователи бурно отреагировали на сообщение о том, что модель может самостоятельно сообщать обо всех властям, если обнаружит вопиюще аморальное поведение.

«Это абсолютно неправильное поведение, и вам нужно от него отказаться — это огромное предательство доверия и скользкий путь», — говорит генеральный директор Stability AI Эмад Мостак.

Другие новости

Все новости