Дольше, но не лучше. Аудиогенератор Stable Audio научили создавать трехминутные треки

Инновации

4 апреля 2024, 13:35

Stability AI выпустила новую версию аудиогенератора с искусственным интеллектом Stable Audio, которая позволяет пользователям создавать песни продолжительностью три минуты.

Первая версия Stable Audio была выпущена в сентябре 2023 года и предлагала создание треков продолжительностью только до 90 секунд для некоторых платных пользователей. Вторая версия модели значительно расширяет возможности пользователей.

«Stable Audio 2.0 позволяет воспроизводить высококачественные, полные треки с согласованной музыкальной структурой продолжительностью до трех минут со стереозвуком 44,1 кГц с одной подсказки на естественном языке», — информирует Stability AI в своем блоге.

Stability AI сделала новую модель бесплатной и общедоступной через свой веб-сайт. Также Stable Audio 2.0 теперь позволяет пользователям загружать собственные образцы аудио, которые они затем могут трансформировать с помощью подсказок и создавать песни, сгенерированные искусственным интеллектом. Все загруженное аудио должно быть без авторских прав.

Журналисты The Verge, протестировавшие модель, отмечают, что треки, созданные ИИ, не звучат естественно. В частности, добавляет к песням вокал, который может напоминать звуки китов или что-то потустороннее.

«Stable Audio 2.0 лучше, чем его предыдущая версия, в том, что песни звучат как песни, но это еще не совсем хорошо. Если модель настаивает на добавлении определенного вокала, возможно, следующая версия будет иметь более разборчивую речь», — пишет репортер Эмилия Дэвид.

Другие компании, такие как Meta и Google, также занимаются созданием аудио с искусственным интеллектом, но еще не опубликовали свои модели. OpenAI создала инструмент для генерации аудио Voice Engine, но он доступен ограниченному количеству пользователей.

Другие новости

Все новости