Зависть — двигатель прогресса? Meta создала четыре команды инженеров, чтобы раскрыть секрет преимущества DeepSeek

29 января 2025, 10:45

Meta собрала четыре команды инженеров, которые будут пытаться определить, как китайской DeepSeek удалось создать модели ИИ, превосходящие еще не выпущенные продукты компании Марка Цукерберга.

Руководитель инфраструктуры Meta AI Мэтью Олдхэм сказал коллегам, что новейшая модель стартапа DeepSeek, который поддерживается хедж-фондом High-Flyer Capital Management, может превзойти даже следующую версию Meta Llama AI, которая, по словам Цукерберга, может быть выпущена в начале 2025 года.

Реклама

Как сообщает The Information со ссылкой на двух сотрудников, компания сформировала сразу четыре команды инженеров, которые будут сконцентрированы на одной цели — догнать китайского конкурента. Две из них попытаются расшифровать, как High-Flyer снизила стоимость обучения и запуска DeepSeek с целью использования этой тактики для Llama. Еще одна попытается выяснить, какие данные использовал DeepSeek для обучения своей модели, а другая рассмотрит, как Llama может реструктурировать свои модели на основе атрибутов моделей DeepSeek.

В Meta утверждают, что этот случай не является уникальным, и анализ достижений конкурентов продолжается постоянно.

«Мы регулярно оцениваем все конкурентоспособные модели в процессе разработки, и делаем это с момента создания компании в сфере генеративного ИИ», — сказал представитель Meta в заявлении The Information.

Показать ещё новости