Заздрість — рушій прогресу? Meta створила чотири команди інженерів, щоб розкрити секрет переваги DeepSeek

IT-індустрія

29 січня 2025, 10:45

Meta зібрала чотири команди інженерів, які намагатимуться визначити, як китайській DeepSeek вдалося створити моделі ШІ, що перевершують ще не випущені продукти компанії Марка Цукерберга.

Керівник інфраструктури Meta AI Метью Олдхем сказав колегам, що найновіша модель стартапу DeepSeek, який підтримується хедж-фондом High-Flyer Capital Management, може перевершити навіть наступну версію Meta Llama AI, яка, за словами Цукерберга, може бути випущена на початку 2025 року.

Як повідомляє The Information з посиланням на двох співробітників, компанія сформувала одразу чотири команди інженерів, що будуть сконцентровані на одній меті - наздогнати китайського конкурента. Дві з них спробують розшифрувати, як High-Flyer знизила вартість навчання та запуску DeepSeek з метою використання цієї тактики для Llama. Ще одна спробує з’ясувати, які дані використовував DeepSeek для навчання своєї моделі, а інша розгляне, як Llama може реструктурувати свої моделі на основі атрибутів моделей DeepSeek.

В Meta переконують, що цей випадок не є унікальним, і аналіз здобутків конкурентів триває постійно.

«Ми регулярно оцінюємо всі конкурентоспроможні моделі в процесі розробки, і робимо це з моменту створення компанії у сфері генеративного ШІ», — сказав представник Meta у заяві The Information.

Інші новини

Всі новини