Deepseek V3 — Новый мощный китайский ИИ путает свое имя с ChatGPT / NV

Автор: Анастасия Печенюк

Китайская лаборатория искусственного интеллекта выпустила модель DeepSeek V3, у которой есть весомый недостаток: она почему-то считает себя продуктом OpenAI.

Deepseek V3 стала настоящим прорывом. Выпущенная на этой неделе модель стала самой мощной открытой языковой моделью в Китае. Первые тесты показали, что она может конкурировать с ведущими моделями в отрасли и демонстрирует преимущества в логическом мышлении. В то же время в ней обнаружили существенную проблему.

Как пишет TechCrunch, DeepSeek V3 идентифицирует себя как ChatGPT, чат-бот-платформу OpenAI на основе ИИ. На просьбу уточнить информацию ИИ настаивает, что это версия модели GPT-4 OpenAI, выпущенная в 2023 году. На вопрос об API DeepSeek модель предоставляет инструкции по использованию API OpenAI. Также среди ответов можно найти почти идентичные с GPT-4 шутки.

DeepSeek не раскрыла всю информацию об источнике учебных данных DeepSeek V3. Но общедоступных наборов данных, содержащих текст, созданный GPT-4 через ChatGPT, предостаточно. Если бы DeepSeek V3 была обучена на них, модель могла запомнить некоторые исходные данные GPT-4 и сейчас воспроизводит их дословно.

«Очевидно, что в какой-то момент модель получает необработанные ответы от ChatGPT, но непонятно, откуда. Это может быть „случайностью“… Но, к сожалению, мы видели случаи, когда люди напрямую обучали свои модели на результатах других моделей», — объясняет исследователь ИИ Майк Кук из Королевского колледжа Лондона.

Ошибка или наглая ложь? Новый мощный китайский ИИ убеждает, что он — ChatGPT