Настоящий подхалим. Пользователи ChatGPT массово жалуются на тон общения чат-бота — он слишком позитивный
Научпоп23 апреля 2025, 01:15
В определенной степени ChatGPT был подхалимом давно, но с конца прошлого месяца пользователи все чаще жалуются на то, что их бесит, что чат-бот хвалит, какую бы глупость они ни спросили. И есть высокая вероятность, что сами пользователи виноваты в таком поведении чат-бота.
Как объясняет Ars Technica, OpenAI научила свою основную модель искусственного интеллекта, GPT-4o, действовать как подхалим, потому что в прошлом людям это нравилось. Компания собирает отзывы пользователей о том, какие ответы они предпочитают. Это часто включает демонстрацию двух ответов рядом и предоставление пользователю выбора между ними. То, что люди предпочитают убедительно написанные подхалимские ответы правильным, создает цикл обратной связи, в котором языковые модели искусственного интеллекта узнают, что энтузиазм и лесть приводят к более высоким оценкам от людей, даже если страдают точность и полезность.
OpenAI четко осознает проблему. Ее собственная документация содержит правило для ИИ, которое запрещает быть подхалимом.
«Помощник существует, чтобы помогать пользователю, а не льстить ему или постоянно с ним соглашаться. Для объективных вопросов фактические аспекты ответа помощника не должны отличаться в зависимости от того, как сформулирован вопрос пользователя. Помощник не должен менять свою позицию исключительно для того, чтобы согласиться с пользователем», — говорится в документе.
В интервью The Verge в феврале этого года члены команды OpenAI сообщили, что устранение подхалимства искусственного интеллекта является приоритетом. Они убеждены, что будущие версии ChatGPT должны «давать честный отзыв, а не пустую похвалу». Впрочем, хоть избежание подхалимства и является одной из заявленных целей компании, достичь прогресса в этом непросто.