Користь для всіх. Інженери об'єдналися для створення повністю відкритого клона ШІ від DeepSeek

IT-індустрія

2 лютого 2025, 13:35

Дослідники ШІ з Hugging Face запустили проєкт Open-R1, в рамках якого намагаються повністю відтворити процес створення вірусної моделі DeepSeek R1, щоб зробити її більш доступного клона.

Усього через тиждень після того, як DeepSeek випустила свою модель штучного інтелекту R1, яка сколихнула ринки, дослідники з Hugging Face узялися до спроб відтворити цю модель з нуля. Керівник відділу досліджень Hugging Face Леандро фон Верра та кілька інженерів компанії запустили Open-R1, проєкт, який має на меті створити дублікат R1 і відкрити вихідний код для всіх його компонентів, включаючи дані, які використовуються для його навчання.

Технічно R1 вже є відкритою, оскільки модель має дозвільну ліцензію, що означає, що її можна розгортати в основному без обмежень. Однак R1 не є моделлю з відкритим вихідним кодом.

«Модель R1 вражає, але немає відкритого набору даних, деталей експерименту чи проміжних моделей, що ускладнює реплікацію та подальші дослідження. Повністю відкритий вихідний код повної архітектури R1 — це не лише про прозорість, це розкриття її потенціалу», — сказав в коментарі TechCrunch Елі Бакуш, один з інженерів Hugging Face, залучених до Open-R1.

Мета проєкту Open-R1 — відтворити R1 за кілька тижнів, частково покладаючись на науковий кластер Hugging Face, виділений дослідницький сервер із 768 графічними процесорами Nvidia H100. DeepSeek стверджувала, що використовувала лише 2048 відеокарт Nvidia H800 і витратила лише 5,6 мільйона доларів на навчання своєї моделі V3 із 671 мільярдом параметрів, що вкрай мало, якщо порівнювати з тим, скільки OpenAI та Google витратили на навчання моделей.

Нагадаємо, Італія заборонила застосунок DeepSeek на тлі проведення розслідування проти компанії з метою встановити, які дані збирає та як з ними поводиться. А комісія із захисту даних Ірландії, яка забезпечує дотримання правил конфіденційності Європейського Союзу, запросила інформацію від DeepSeek, щоб визначити, чи належним чином компанія захищає дані користувачів.

Інші новини

Всі новини