DeepSeek R1 — Вирусную китайскую ИИ-модель пытаются клонировать / NV

Автор: Анастасия Печенюк

Исследователи ИИ из Hugging Face запустили проект Open-R1, в рамках которого пытаются полностью воссоздать процесс создания вирусной модели DeepSeek R1, чтобы сделать ее более доступного клона.

Всего через неделю после того, как DeepSeek выпустиа свою модель искусственного интеллекта R1, которая всколыхнула рынки, исследователи из Hugging Face приступили к попыткам воссоздать эту модель с нуля. Руководитель отдела исследований Hugging Face Леандро фон Верра и несколько инженеров компании запустили Open-R1, проект, который имеет целью создать дубликат R1 и открыть исходный код для всех его компонентов, включая данные, используемые для его обучения.

Технически R1 уже является открытой, поскольку модель имеет разрешительную лицензию, что означает, что ее можно развертывать в основном без ограничений. Однако R1 не является моделью с открытым исходным кодом.

«Модель R1 впечатляет, но нет открытого набора данных, деталей эксперимента или промежуточных моделей, что затрудняет репликацию и дальнейшие исследования. Полностью открытый исходный код полной архитектуры R1 — это не только о прозрачности, это раскрытие ее потенциала», — сказал в комментарии TechCrunch Эли Бакуш, один из инженеров Hugging Face, привлеченных к Open-R1.

Цель проекта Open-R1 — воссоздать R1 за несколько недель, частично полагаясь на научный кластер Hugging Face, выделенный исследовательский сервер с 768 графическими процессорами Nvidia H100. DeepSeek утверждала, что использовала только 2048 видеокарт Nvidia H800 и потратила лишь 5,6 миллиона долларов на обучение своей модели V3 с 671 миллиардом параметров, что крайне мало по сравнению с тем, сколько OpenAI и Google потратили на обучение моделей.

Напомним, Италия запретила приложение DeepSeek на фоне проведения расследования против компании с целью установить, какие данные собирает и как с ними обращается. А комиссия по защите данных Ирландии, которая обеспечивает соблюдение правил конфиденциальности Европейского Союза, запросила информацию от DeepSeek, чтобы определить, должным ли образом компания защищает данные пользователей.

Польза для всех. Инженеры объединились для создания полностью открытого клона ИИ от DeepSeek