Шукайте іншого спільника. ШІ від Anthropic може повідомляти владі про злочинні наміри користувача
Інновації25 травня 2025, 21:44
22 травня Anthropic представила Claude Opus 4 та Claude Sonnet 4. Розробники називають Claude Opus 4 своєю найпотужнішою моделлю на сьогодні, «і найкращою у світі моделлю кодування», тоді як Claude Sonnet 4 пропонується як вдосконалена модель з чудовими можливостями кодування та логічним мисленням. Однак випуск моделей був затьмарений суперечками щодо них.
Дослідник штучного інтелекту з Anthropic Сем Боумен написав на X, що чат-бот «використовуватиме інструменти командного рядка для зв’язку з пресою, зв’язку з регуляторними органами, щоб заблокувати вам доступ до відповідних систем або все це разом». Однак пізніше Боумен заявив, що він «видалив попередній твіт про викриття, оскільки його виривали з контексту».
Він уточнив, що ця функція з’явилася лише в «тестових середовищах, де їй надається надзвичайно вільний доступ до інструментів та дуже незвичайних інструкцій».
Розробники та користувачі бурхливо відреагували на повідомлення про те, що модель може самостійно повідомляти про всіх владі, якщо виявить кричуще аморальну.
«Це абсолютно неправильна поведінка, і вам потрібно від неї відмовитися — це величезна зрада довіри та слизький шлях», — каже генеральний директор Stability AI Емад Мостак.