Виклик для OpenAI. DeepSeek випустила ШІ для зображень, що перевершує DALL-E 3

Інновації

28 січня 2025, 11:15

Китайська компанія у сфері штучного інтелекту DeepSeek, яка перебуває на піку популярності, випустила новий набір мультимодальних моделей Janus-Pro, що можуть перевершити DALL-E 3 від OpenAI.

Janus-Pro знаходиться під ліцензією Массачусетського технологічного інституту, тобто їх можна використовувати в комерційних цілях без обмежень. Моделі доступні для завантаження з платформи для розробників ШІ Hugging Face.

Вони мають розмір від 1 мільярда до 7 мільярдів параметрів. Параметри приблизно відповідають навичкам моделі розв’язувати проблеми. Моделі з більшою кількістю параметрів, як правило, працюють краще, ніж моделі з меншою кількістю параметрів.

DeepSeek описує Janus-Pro як «нову систему авторегресії», що може як аналізувати, так і створювати нові зображення. За даними компанії, за двома тестами оцінки ШІ, GenEval і DPG-Bench, найбільша модель Janus-Pro, Janus-Pro-7B, перемагає DALL-E 3, а також такі моделі, як PixArt-alpha, Emu3-Gen і Stable Diffusion XL від Stability AI.

Деякі з цих моделей є старішими, і більшість моделей Janus-Pro можуть аналізувати лише невеликі зображення з роздільною здатністю до 384×384. Але продуктивність Janus-Pro вражає, враховуючи компактні розміри моделей.

DeepSeek — що відомо про компанію, яка спровокувала вибух на Волл-стріт

DeepSeek — це китайська лабораторія штучного інтелекту, яка в основному фінансується китайською торговою компанією High-Flyer Capital Management. Після релізу її моделі компанії R1, що працює за тим самим принципом, що й o1 від OpenAI, але коштує значно менше, її помічник зі штучним інтелектом став найпопулярнішим безплатним застосунком в США, випередивши ChatGPT. Акції великих компаній у сфері ШІ, включно з виробниками чипів NVIDIA, ASML та техногігантами Microsoft і Meta, впали на цьому тлі.

Водночас повсюдно обговорюються потенційні негативні наслідки використання цих моделей. Занепокоєння викликає стандартна для китайських моделей ШІ проблема — цензура. У мережі активно обговорюють скриншоти чатів з DeepSeek, в яких ШІ безпосередньо заперечує різні діяння комуністичної влади Китаю.

Інші новини

Всі новини