Зависть — двигатель прогресса? Meta создала четыре команды инженеров, чтобы раскрыть секрет преимущества DeepSeek
IT-индустрия29 января 2025, 10:45
Руководитель инфраструктуры Meta AI Мэтью Олдхэм сказал коллегам, что новейшая модель стартапа DeepSeek, который поддерживается хедж-фондом High-Flyer Capital Management, может превзойти даже следующую версию Meta Llama AI, которая, по словам Цукерберга, может быть выпущена в начале 2025 года.
Как сообщает The Information со ссылкой на двух сотрудников, компания сформировала сразу четыре команды инженеров, которые будут сконцентрированы на одной цели — догнать китайского конкурента. Две из них попытаются расшифровать, как High-Flyer снизила стоимость обучения и запуска DeepSeek с целью использования этой тактики для Llama. Еще одна попытается выяснить, какие данные использовал DeepSeek для обучения своей модели, а другая рассмотрит, как Llama может реструктурировать свои модели на основе атрибутов моделей DeepSeek.
В Meta утверждают, что этот случай не является уникальным, и анализ достижений конкурентов продолжается постоянно.
«Мы регулярно оцениваем все конкурентоспособные модели в процессе разработки, и делаем это с момента создания компании в сфере генеративного ИИ», — сказал представитель Meta в заявлении The Information.