Брудні ігри. Китайського гіганта у сфері ШІ викрили у крадіжці технологій Google

6 червня 2025, 15:10

DeepSeek випустила оновлену версію своєї моделі штучного інтелекту R1, яку, ймовірно, було навчено на вихідних даних Google Gemini.

Презентуючи оновлену модель, яка демонструє хороші результати в низці тестів з математики та кодування, DeepSeek не розкрила джерело даних, які вона використовувала для навчання. Деякі дослідники штучного інтелекту припускають, що принаймні частина даних походить з сімейства штучного інтелекту Gemini від Google, пише TechCrunch.

Реклама

Розробник Сем Паеч помітив, що модель DeepSeek під назвою R1−0528 віддає перевагу словам і виразам, подібним до тих, яким надає перевагу Google Gemini 2.5 Pro. Це не є неспростовним доказом, але інший розробник зазначив, що сліди моделі DeepSeek — «думки», які генерує модель, працюючи над висновком, — «читаються як сліди Gemini».

Нагадаємо, DeepSeek і раніше звинувачували у навчанні на даних моделей штучного інтелекту конкурентів. У грудні розробники помітили, що модель DeepSeek V3 часто ідентифікувала себе як ChatGPT, платформу чат-ботів OpenAI на базі штучного інтелекту, що свідчить про те, що вона могла бути навчена на журналах чату ChatGPT.

Раніше цього року OpenAI повідомила Financial Times, що знайшла докази, що пов’язують DeepSeek з використанням дистиляції — методу навчання моделей штучного інтелекту шляхом вилучення даних з більших та потужніших моделей.

Показати ще новини