Заздрість — рушій прогресу? Meta створила чотири команди інженерів, щоб розкрити секрет переваги DeepSeek
IT-індустрія29 січня 2025, 10:45
Керівник інфраструктури Meta AI Метью Олдхем сказав колегам, що найновіша модель стартапу DeepSeek, який підтримується хедж-фондом High-Flyer Capital Management, може перевершити навіть наступну версію Meta Llama AI, яка, за словами Цукерберга, може бути випущена на початку 2025 року.
Як повідомляє The Information з посиланням на двох співробітників, компанія сформувала одразу чотири команди інженерів, що будуть сконцентровані на одній меті - наздогнати китайського конкурента. Дві з них спробують розшифрувати, як High-Flyer знизила вартість навчання та запуску DeepSeek з метою використання цієї тактики для Llama. Ще одна спробує з’ясувати, які дані використовував DeepSeek для навчання своєї моделі, а інша розгляне, як Llama може реструктурувати свої моделі на основі атрибутів моделей DeepSeek.
В Meta переконують, що цей випадок не є унікальним, і аналіз здобутків конкурентів триває постійно.
«Ми регулярно оцінюємо всі конкурентоспроможні моделі в процесі розробки, і робимо це з моменту створення компанії у сфері генеративного ШІ», — сказав представник Meta у заяві The Information.