Створює музику і голоси. Nvidia презентувала дуже потужний аудіогенератор

28 листопада 2024, 17:35

Nvidia випустила новий інструмент зі штучним інтелектом Fugatto, здатний створювати «звуки, яких ви ніколи раніше не чули» на основі простих текстових підказок.

Нова модель Nvidia генерує або перетворює будь-яку суміш музики, голосів і звуків, описаних підказками чи за допомогою комбінації текстових і аудіофайлів. Над створення експериментального генеративного штучного інтелекту Foundational Generative Audio Transformer Opus 1 (Fugatto) понад рік працювала міжнародна команда дослідників. Це, стверджує Nvidia, «зробило багатоакцентні та багатомовні можливості Fugatto сильнішими».

Реклама

Компанія переконує, що Fugatto, на відміну від більшості моделей, які можуть лише відтворювати тренувальні дані, дозволяє користувачам створювати нові звукові пейзажі, як гроза, що стихає до світанку, зі співом птахів.

«Ми хотіли створити модель, яка розуміє і генерує звук так само як це роблять люди», — каже менеджер із прикладних аудіодосліджень у Nvidia Рафаель Валле.

Розробники кажуть, що Fugatto стане в пригоді музичним продюсерам, які зможуть створювати та вдосконалювати музичні чернетки, творцям відеоігор, які зможуть легко генерувати аудіосупровід для своїх проєктів. Зрештою, інструмент може допомогти й з вивченням мов. Коли модель стане доступною широкому загалу — поки невідомо.

Проєкт Nvidia не є унікальним. Раніше Google представила модель MusicLM, який перетворює текст на музику. Свій генератор звуків на основі текстової підказки представила й Meta.

Показати ще новини