Дарио Амодей из Anthropic хочет дать ИИ право выбирать, что делать / NV

Автор: Анастасия Печенюк

Генеральный директор Anthropic Дарио Амодей предполагает, что в конце концов искусственному интеллекту может быть предоставлено право отказываться от поставленных задач, если они кажутся неприятными.

Амодей признал, что сама идея позволить инструменту, который должен облегчить для человека выполнение какой-то задачи, отказываться от этого, «звучит безумно». В то же время он обосновал, почему такая возможность была бы полезной.

«Это еще одна из тех тем, которые заставят меня показаться абсолютно сумасшедшим. Я думаю, что мы должны по крайней мере рассмотреть вопрос: если мы строим эти системы, и они делают всякие вещи, как люди, так же как и люди, и, кажется, имеют одинаковые когнитивные способности, если они крякают, как утки, и ходят, как утки, возможно, это утки. … Мы думаем о том, чтобы … просто дать модели кнопку с надписью „Я увольняюсь с этой работы“, которую модель может нажать. … Предположим, у модели есть опыт и она достаточно ненавидит свою работу, вы даете ей возможность нажать кнопку „Я увольняюсь с этой работы“. Если вы видите, что модели часто нажимают на эту кнопку из-за вещей, которые действительно неприятны, знаете, возможно, вам стоит … обратить на это внимание», — объясняет Амодей в интервью в Council on Foreign Relations.

Напомним, в 2023 году люди часто жаловались на отказы ChatGPT выполнять различные задачи. Явление было сезонным, что заставило предположить, что это — результат обучения на данных о людях, которые брали зимние каникулы и не работали так тяжело в определенное время года. В прошлом году компания Anthropic испытала собственную версию «гипотезы зимних каникул», когда люди утверждали, что ее чат-бот Claude стал ленивым в августе.

«Безумная вещь». Гендиректор Anthropic предлагает предоставить ИИ право отказываться от задач, которые не нравятся