Ищите другого сообщника. ИИ от Anthropic может сообщать властям о преступных намерениях пользователя
Anthropic оказалась в центре скандала после того, как ее исследователь Сэм Боумен сообщил о тестировании возможности чат-бота самостоятельно сообщать о пользователях властям в случае обнаружения вопиюще аморального поведения.
22 мая Anthropic представила Claude Opus 4 и Claude Sonnet 4. Разработчики называют Claude Opus 4 своей самой мощной моделью на сегодня, «и лучшей в мире моделью кодирования», тогда как Claude Sonnet 4 предлагается как усовершенствованная модель с превосходными возможностями кодирования и логическим мышлением. Однако выпуск моделей был омрачен спорами о них.
Исследователь искусственного интеллекта из Anthropic Сэм Боумен написал на X, что чат-бот «будет использовать инструменты командной строки для связи с прессой, связи с регуляторными органами, чтобы заблокировать вам доступ к соответствующим системам или все это вместе». Однако позже Боумен заявил, что он «удалил предыдущий твит о разоблачении, поскольку его вырывали из контекста».
Он уточнил, что эта функция появилась только в «тестовых средах, где ей предоставляется чрезвычайно свободный доступ к инструментам и очень необычным инструкциям».
Разработчики и пользователи бурно отреагировали на сообщение о том, что модель может самостоятельно сообщать обо всех властям, если обнаружит вопиюще аморальное поведение.
«Это абсолютно неправильное поведение, и вам нужно от него отказаться — это огромное предательство доверия и скользкий путь», — говорит генеральный директор Stability AI Эмад Мостак.