Ошибка или наглая ложь? Новый мощный китайский ИИ убеждает, что он — ChatGPT
IT-индустрия31 декабря 2024, 00:55
Deepseek V3 стала настоящим прорывом. Выпущенная на этой неделе модель стала самой мощной открытой языковой моделью в Китае. Первые тесты показали, что она может конкурировать с ведущими моделями в отрасли и демонстрирует преимущества в логическом мышлении. В то же время в ней обнаружили существенную проблему.
Как пишет TechCrunch, DeepSeek V3 идентифицирует себя как ChatGPT, чат-бот-платформу OpenAI на основе ИИ. На просьбу уточнить информацию ИИ настаивает, что это версия модели GPT-4 OpenAI, выпущенная в 2023 году. На вопрос об API DeepSeek модель предоставляет инструкции по использованию API OpenAI. Также среди ответов можно найти почти идентичные с GPT-4 шутки.
DeepSeek не раскрыла всю информацию об источнике учебных данных DeepSeek V3. Но общедоступных наборов данных, содержащих текст, созданный GPT-4 через ChatGPT, предостаточно. Если бы DeepSeek V3 была обучена на них, модель могла запомнить некоторые исходные данные GPT-4 и сейчас воспроизводит их дословно.
«Очевидно, что в какой-то момент модель получает необработанные ответы от ChatGPT, но непонятно, откуда. Это может быть „случайностью“… Но, к сожалению, мы видели случаи, когда люди напрямую обучали свои модели на результатах других моделей», — объясняет исследователь ИИ Майк Кук из Королевского колледжа Лондона.
Кук отметил, что практика обучения моделей на результатах систем искусственного интеллекта от конкурентов может быть очень плохой для качества модели, поскольку это может привести к галлюцинациям и ложным ответам, подобным приведенным выше.
«Подобно фотокопии фотокопии, мы теряем все больше информации и связи с реальностью», — говорит Кук.
Условия OpenAI запрещают пользователям его продуктов, включая клиентов ChatGPT, использовать результаты для разработки моделей, конкурирующих с собственными OpenAI. Вполне возможно, что DeepSeek обучила DeepSeek V3 непосредственно на тексте, сгенерированном ChatGPT.