Перестарались. OpenAI сворачивает последнюю версию GPT-4o из-за подхалимского тона
Генеральный директор OpenAI Сэм Альтман объявил о сворачивании последнего обновления модели искусственного интеллекта GPT-4o, раскритикованного за подхалимство, от которого страдала эффективность.
GPT-4o не является новой моделью — OpenAI выпустила ее почти год назад, и она остается версией по умолчанию при доступе к ChatGPT. Но компания время от времени выпускает пересмотренные версии существующих моделей. Когда люди взаимодействуют с чат-ботом, OpenAI собирает данные об ответах, которые им нравятся больше. Затем инженеры пересматривают производственную модель с помощью метода, который называется обучением с подкреплением на основе человеческой обратной связи (RLHF).
Однако недавно это обучение с подкреплением привело к тому, что искусственный интеллект превратился из в целом позитивного собеседника в самого большого подхалима. Пользователи могли представить ChatGPT абсолютно ужасные идеи или ложные утверждения, и он непременно забрасывал их комплиментами за эти невероятные мысли и вопросы. В OpenAI признали наличие проблемы и уже работают над ее решением.
«Последние несколько обновлений GPT-4o сделали характер слишком занудным и раздражающим (хотя есть некоторые очень хорошие моменты), и мы работаем над исправлениями так быстро, как только можем. … Мы начали откатывать последнее обновление GPT-4o прошлой ночью. ... Мы работаем над дополнительными исправлениями для моделирования характера и предоставим больше [информации] в ближайшие дни», — написал Альтман в X.