Польза для всех. Инженеры объединились для создания полностью открытого клона ИИ от DeepSeek
IT-индустрия2 февраля 2025, 13:35
Всего через неделю после того, как DeepSeek выпустиа свою модель искусственного интеллекта R1, которая всколыхнула рынки, исследователи из Hugging Face приступили к попыткам воссоздать эту модель с нуля. Руководитель отдела исследований Hugging Face Леандро фон Верра и несколько инженеров компании запустили Open-R1, проект, который имеет целью создать дубликат R1 и открыть исходный код для всех его компонентов, включая данные, используемые для его обучения.
Технически R1 уже является открытой, поскольку модель имеет разрешительную лицензию, что означает, что ее можно развертывать в основном без ограничений. Однако R1 не является моделью с открытым исходным кодом.
«Модель R1 впечатляет, но нет открытого набора данных, деталей эксперимента или промежуточных моделей, что затрудняет репликацию и дальнейшие исследования. Полностью открытый исходный код полной архитектуры R1 — это не только о прозрачности, это раскрытие ее потенциала», — сказал в комментарии TechCrunch Эли Бакуш, один из инженеров Hugging Face, привлеченных к Open-R1.
Цель проекта Open-R1 — воссоздать R1 за несколько недель, частично полагаясь на научный кластер Hugging Face, выделенный исследовательский сервер с 768 графическими процессорами Nvidia H100. DeepSeek утверждала, что использовала только 2048 видеокарт Nvidia H800 и потратила лишь 5,6 миллиона долларов на обучение своей модели V3 с 671 миллиардом параметров, что крайне мало по сравнению с тем, сколько OpenAI и Google потратили на обучение моделей.
Напомним, Италия запретила приложение DeepSeek на фоне проведения расследования против компании с целью установить, какие данные собирает и как с ними обращается. А комиссия по защите данных Ирландии, которая обеспечивает соблюдение правил конфиденциальности Европейского Союза, запросила информацию от DeepSeek, чтобы определить, должным ли образом компания защищает данные пользователей.