«Великий талант». Бос Anthropic пояснив, як шалений успіх китайського ШІ DeepSeek став можливим

IT-індустрія

1 лютого 2025, 02:55

Даріо Амодей, генеральний директор Anthropic, відреагував на дискусії про те, чи означає успіх китайської компанії DeepSeek неефективність американського експортного контролю.

Амодей переконаний, що експортний контроль США уповільнює прогрес китайських компаній, таких як DeepSeek. За його словами, свіжі моделі DeepSeek мають можливості американських продуктів, випущених багато місяців тому.

«DeepSeek випустила модель, близьку до американських моделей на 7−10 місяців старше, за значно меншу ціну. … Це очікувана точка на кривій зниження витрат, яке триває. Відмінність цього разу полягає в тому, що компанія, яка першою продемонструвала очікуване скорочення витрат, була китайською», — пише керівник Anthropic у блозі.

Амодей, називає розробників DeepSeek «дуже талановитими інженерами», які «показують, чому Китай є серйозним конкурентом США». Водночас він зауважує, що моделі DeepSeek не є ефективнішими за американські. Амодей порівнює одну з флагманських моделей DeepSeek, DeepSeek V3, з Claude 3.5 Sonnet від Anthropic, навчання якої, за його словами, коштувало «кілька десятків мільйонів доларів». Навчання Sonnet завершилося 9−12 місяців тому, моделі DeepSeek — в листопаді або грудні.

«Американські компанії досягають звичайної тенденції до скорочення витрат. Інновації з підвищення ефективності, розроблені DeepSeek, незабаром будуть застосовуватися як американськими, так і китайськими лабораторіями для навчання багатомільярдних моделей», — додає Амодей.

Нагадаємо, DeepSeek стверджувала, що використовувала лише 2048 відеокарт Nvidia H800 і витратила лише 5,6 мільйона доларів на навчання своєї моделі V3 із 671 мільярдом параметрів. Це вкрай мало, якщо порівнювати з тим, скільки OpenAI та Google витратили на навчання моделей. OpenAI звинувачувала китайську компанію у порушенні умов використання ChatGPT для створення своїх продуктів.

Інші новини

Всі новини