«Божевільна річ». Гендиректор Anthropic пропонує надати ШІ право відмовлятися від завдань, які не до вподоби
IT-індустрія15 березня 2025, 13:35
Амодей визнав, що сама ідея дозволити інструменту, який має полегшити для людини виконання якогось завдання, відмовлятися від цього, «звучить божевільно». Водночас він обґрунтував, чому така можливість була б корисною.
«Це ще одна з тих тем, які змусять мене здатися абсолютно божевільним. Я думаю, що ми повинні принаймні розглянути питання: якщо ми будуємо ці системи, і вони роблять усілякі речі, як люди, так само як і люди, і, здається, мають однакові когнітивні здібності, якщо вони крякають, як качки, і ходять, як качки, можливо, це качки. … Ми думаємо про те, щоб … просто дати моделі кнопку з написом „Я звільняюся з цієї роботи“, яку модель може натиснути. … Припустимо, у моделі є досвід і вона достатньо ненавидить свою роботу, ви даєте їй можливість натиснути кнопку „Я звільняюся з цієї роботи“. Якщо ви бачите, що моделі часто натискають на цю кнопку через речі, які дійсно неприємні, знаєте, можливо, вам варто … звернути на це увагу», — пояснює Амодей в інтерв'ю в Council on Foreign Relations.
Нагадаємо, у 2023 році люди часто скаржилися на відмови ChatGPT виконувати різні завдання. Явище було сезонним, що змусило припустити, що це — результат навчання на даних про людей, які брали зимові канікули та не працювали так важко в певну пору року. Минулого року компанія Anthropic випробувала власну версію «гіпотези зимових канікул», коли люди стверджували, що її чат-бот Claude став ледачим у серпні.