Змагання з OpenAI триває. DeepSeek прокачала свій ШІ, поліпшивши можливості програмування
Китайський стартап DeepSeek, чиї дешеві та ефективні моделі штучного інтелекту стали вірусними на початку року, випустила оновлення для свого продукту V3.
Оновлення V3−0324, опубліковане на Hugging Face цього тижня без офіційного оголошення, спрямоване на підвищення точності та ефективності.
«DeepSeek-V3−0324 демонструє помітні поліпшення порівняно зі своїм попередником, DeepSeek-V3, у кількох ключових аспектах», — стверджують розробники.
Оновлена модель, як демонструє діаграма, надана DeepSeek, показала найкращі результати в кількох галузевих тестах, як-от MMLU-Pro, що оцінює здатність моделі точно відповідати на запитання з різних предметних царин, GPQA Diamond, що оцінює правильність відповідей із першої спроби, MATH-500, який оцінює здатність моделі розв’язувати математичні задачі, і так далі.
Розробники обіцяють, що оновлення надасть кращі можливості у сфері програмування. У тесті LiveCodeBench, який оцінює здатність моделі генерувати код на основі текстових описів, V3−0324 краща за V3 на 10%. Також у більшості тестів V3−0324 перевершила моделі конкурентів, зокрема GPT-4.5 від OpenAI.
Нагадаємо, V3 є старішою платформою DeepSeek. У січні DeepSeek стала неймовірно популярною завдяки її моделі R1, яка показала найкращі показники в галузі за значно менших витрат.