Помилка чи зухвала брехня? Новий потужний китайський ШІ переконує, що він — ChatGPT
IT-індустрія31 грудня 2024, 00:55
Deepseek V3 стала справжнім проривом. Випущена цього тижня модель стала найпотужнішою відкритою мовною моделлю в Китаї. Перші тести показали, що вона може конкурувати з провідними моделями в галузі та демонструє переваги у логічному мисленні. Водночас у ній виявили суттєву проблему.
Як пише TechCrunch, DeepSeek V3 ідентифікує себе як ChatGPT, чат-бот-платформу OpenAI на основі ШІ. На прохання уточнити інформацію ШІ наполягає, що це версія моделі GPT-4 OpenAI, випущена у 2023 році. На запитання про API DeepSeek модель надає інструкції щодо використання API OpenAI. Також серед відповідей можна знайти майже ідентичні з GPT-4 жарти.
DeepSeek не розкрила всю інформацію про джерело навчальних даних DeepSeek V3. Але загальнодоступних наборів даних, що містять текст, створений GPT-4 через ChatGPT, не бракує. Якби DeepSeek V3 була навчена на них, модель могла запам’ятати деякі вихідні дані GPT-4 і зараз відтворює їх дослівно.
«Очевидно, що в якийсь момент модель отримує необроблені відповіді від ChatGPT, але незрозуміло, звідки. Це може бути „випадковим“… Але, на жаль, ми бачили випадки, коли люди безпосередньо навчали свої моделі на результатах інших моделей», — пояснює дослідник ШІ Майк Кук з Королівського коледжу Лондона.
Кук зазначив, що практика навчання моделей на результатах систем штучного інтелекту від конкурентів може бути дуже поганою для якості моделі, оскільки це може призвести до галюцинацій і оманливих відповідей, подібних до наведених вище.
«Подібно до фотокопії фотокопії, ми втрачаємо все більше інформації та зв’язку з реальністю», — каже Кук.
Умови OpenAI забороняють користувачам його продуктів, включаючи клієнтів ChatGPT, використовувати результати для розробки моделей, які конкурують з власними OpenAI.