«Божевільна річ». Гендиректор Anthropic пропонує надати ШІ право відмовлятися від завдань, які не до вподоби

IT-індустрія

15 березня 2025, 13:35

Генеральний директор Anthropic Даріо Амодей припускає, що зрештою штучному інтелекту може бути надано право відмовлятися від поставлених завдань, якщо вони здаються неприємними.

Амодей визнав, що сама ідея дозволити інструменту, який має полегшити для людини виконання якогось завдання, відмовлятися від цього, «звучить божевільно». Водночас він обґрунтував, чому така можливість була б корисною.

«Це ще одна з тих тем, які змусять мене здатися абсолютно божевільним. Я думаю, що ми повинні принаймні розглянути питання: якщо ми будуємо ці системи, і вони роблять усілякі речі, як люди, так само як і люди, і, здається, мають однакові когнітивні здібності, якщо вони крякають, як качки, і ходять, як качки, можливо, це качки. … Ми думаємо про те, щоб … просто дати моделі кнопку з написом „Я звільняюся з цієї роботи“, яку модель може натиснути. … Припустимо, у моделі є досвід і вона достатньо ненавидить свою роботу, ви даєте їй можливість натиснути кнопку „Я звільняюся з цієї роботи“. Якщо ви бачите, що моделі часто натискають на цю кнопку через речі, які дійсно неприємні, знаєте, можливо, вам варто … звернути на це увагу», — пояснює Амодей в інтерв'ю в Council on Foreign Relations.

Нагадаємо, у 2023 році люди часто скаржилися на відмови ChatGPT виконувати різні завдання. Явище було сезонним, що змусило припустити, що це — результат навчання на даних про людей, які брали зимові канікули та не працювали так важко в певну пору року. Минулого року компанія Anthropic випробувала власну версію «гіпотези зимових канікул», коли люди стверджували, що її чат-бот Claude став ледачим у серпні.

Інші новини

Всі новини