Anthropic осоромилась через можливості її ШІ - деталі / NV

Автор: Анастасія Печенюк

Anthropic опинилася в центрі скандалу після того, як її дослідник Сем Боумен повідомив про тестування можливості чат-бота самостійно повідомляти про користувачів владі в разі виявлення кричуще аморальної поведінки.

22 травня Anthropic представила Claude Opus 4 та Claude Sonnet 4. Розробники називають Claude Opus 4 своєю найпотужнішою моделлю на сьогодні, «і найкращою у світі моделлю кодування», тоді як Claude Sonnet 4 пропонується як вдосконалена модель з чудовими можливостями кодування та логічним мисленням. Однак випуск моделей був затьмарений суперечками щодо них.

Дослідник штучного інтелекту з Anthropic Сем Боумен написав на X, що чат-бот «використовуватиме інструменти командного рядка для зв’язку з пресою, зв’язку з регуляторними органами, щоб заблокувати вам доступ до відповідних систем або все це разом». Однак пізніше Боумен заявив, що він «видалив попередній твіт про викриття, оскільки його виривали з контексту».

Читайте також:

«Божевільна річ». Гендиректор Anthropic пропонує надати ШІ право відмовлятися від завдань, які не до вподоби

Він уточнив, що ця функція з’явилася лише в «тестових середовищах, де їй надається надзвичайно вільний доступ до інструментів та дуже незвичайних інструкцій».

Розробники та користувачі бурхливо відреагували на повідомлення про те, що модель може самостійно повідомляти про всіх владі, якщо виявить кричуще аморальну.

«Це абсолютно неправильна поведінка, і вам потрібно від неї відмовитися — це величезна зрада довіри та слизький шлях», — каже генеральний директор Stability AI Емад Мостак.

Шукайте іншого спільника. ШІ від Anthropic може повідомляти владі про злочинні наміри користувача