ChatGPT ведет себя как подхалим — в чем опасность такого ИИ / NV

Автор: Анастасия Печенюк

Последние обновления моделей ИИ от OpenAI сделали ее чат-бот с искусственным интеллектом еще более позитивным и дружелюбным, и это доводит многих людей до бешенства. Компания уже несколько месяцев тщетно борется с этим.

В определенной степени ChatGPT был подхалимом давно, но с конца прошлого месяца пользователи все чаще жалуются на то, что их бесит, что чат-бот хвалит, какую бы глупость они ни спросили. И есть высокая вероятность, что сами пользователи виноваты в таком поведении чат-бота.

Как объясняет Ars Technica, OpenAI научила свою основную модель искусственного интеллекта, GPT-4o, действовать как подхалим, потому что в прошлом людям это нравилось. Компания собирает отзывы пользователей о том, какие ответы они предпочитают. Это часто включает демонстрацию двух ответов рядом и предоставление пользователю выбора между ними. То, что люди предпочитают убедительно написанные подхалимские ответы правильным, создает цикл обратной связи, в котором языковые модели искусственного интеллекта узнают, что энтузиазм и лесть приводят к более высоким оценкам от людей, даже если страдают точность и полезность.

OpenAI четко осознает проблему. Ее собственная документация содержит правило для ИИ, которое запрещает быть подхалимом.

«Помощник существует, чтобы помогать пользователю, а не льстить ему или постоянно с ним соглашаться. Для объективных вопросов фактические аспекты ответа помощника не должны отличаться в зависимости от того, как сформулирован вопрос пользователя. Помощник не должен менять свою позицию исключительно для того, чтобы согласиться с пользователем», — говорится в документе.

В интервью The Verge в феврале этого года члены команды OpenAI сообщили, что устранение подхалимства искусственного интеллекта является приоритетом. Они убеждены, что будущие версии ChatGPT должны «давать честный отзыв, а не пустую похвалу». Впрочем, хоть избежание подхалимства и является одной из заявленных целей компании, достичь прогресса в этом непросто.

Настоящий подхалим. Пользователи ChatGPT массово жалуются на тон общения чат-бота — он слишком позитивный