Користь для всіх. Інженери об'єдналися для створення повністю відкритого клона ШІ від DeepSeek
IT-індустрія2 лютого 2025, 13:35
Усього через тиждень після того, як DeepSeek випустила свою модель штучного інтелекту R1, яка сколихнула ринки, дослідники з Hugging Face узялися до спроб відтворити цю модель з нуля. Керівник відділу досліджень Hugging Face Леандро фон Верра та кілька інженерів компанії запустили Open-R1, проєкт, який має на меті створити дублікат R1 і відкрити вихідний код для всіх його компонентів, включаючи дані, які використовуються для його навчання.
Технічно R1 вже є відкритою, оскільки модель має дозвільну ліцензію, що означає, що її можна розгортати в основному без обмежень. Однак R1 не є моделлю з відкритим вихідним кодом.
«Модель R1 вражає, але немає відкритого набору даних, деталей експерименту чи проміжних моделей, що ускладнює реплікацію та подальші дослідження. Повністю відкритий вихідний код повної архітектури R1 — це не лише про прозорість, це розкриття її потенціалу», — сказав в коментарі TechCrunch Елі Бакуш, один з інженерів Hugging Face, залучених до Open-R1.
Мета проєкту Open-R1 — відтворити R1 за кілька тижнів, частково покладаючись на науковий кластер Hugging Face, виділений дослідницький сервер із 768 графічними процесорами Nvidia H100. DeepSeek стверджувала, що використовувала лише 2048 відеокарт Nvidia H800 і витратила лише 5,6 мільйона доларів на навчання своєї моделі V3 із 671 мільярдом параметрів, що вкрай мало, якщо порівнювати з тим, скільки OpenAI та Google витратили на навчання моделей.
Нагадаємо, Італія заборонила застосунок DeepSeek на тлі проведення розслідування проти компанії з метою встановити, які дані збирає та як з ними поводиться. А комісія із захисту даних Ірландії, яка забезпечує дотримання правил конфіденційності Європейського Союзу, запросила інформацію від DeepSeek, щоб визначити, чи належним чином компанія захищає дані користувачів.