Як відкрити «злу» версію ChatGPT і змусити його облаяти політика? Вам допоможе ця проста підказка
Користувачі Reddit придумали, як змусити чат-бот від OpenAI порушити власні програмні обмеження. Якщо активувати його «злу» версію, ChatGPT починає лаятись, видавати «контроверсійні» заяви щодо політиків та розповідати історії, які «заховані» за політикою безпеки.
ChatGPT став ледь не найпопулярнішим сервісом останнього часу. Мільйони людей почали використовувати його для роботи, замість Google або просто задля розваги.
Популярність чат-бота спровокувала цілу хвилю спроб «зламати» його. Користувачі намагалися добитися від ChatGPT «щирих» відповідей щодо різних публічних людей, зокрема політиків, питали у нього інструкції щодо ідеальних крадіжок у магазині, вбивств і ставили інші провокативні питання.
Спочатку чат-бот чесно відповідав на всі ці питання, а тому OpenAI активно закривала ці діри, оскільки такі публікації точно не допомагали репутації компанії. Якщо штучний інтелект буквально може дати інструкцію з виготовлення бомби, то очевидно, що фінансування його подальшого розвитку стоятиме під великим питанням.
Компанія запроваджувала все більше засобів контролю — зокрема й експлуатуючи модераторів з африканських країн, які допомагали зробити відповіді ChatGPT менш токсичними, прибрати з масивів даних для навчання приклади мови ворожнечі, розпалювання ненависті, сексуального насильства тощо.