Дольше, но не лучше. Аудиогенератор Stable Audio научили создавать трехминутные треки
Инновации4 апреля 2024, 13:35
Первая версия Stable Audio была выпущена в сентябре 2023 года и предлагала создание треков продолжительностью только до 90 секунд для некоторых платных пользователей. Вторая версия модели значительно расширяет возможности пользователей.
«Stable Audio 2.0 позволяет воспроизводить высококачественные, полные треки с согласованной музыкальной структурой продолжительностью до трех минут со стереозвуком 44,1 кГц с одной подсказки на естественном языке», — информирует Stability AI в своем блоге.
Stability AI сделала новую модель бесплатной и общедоступной через свой веб-сайт. Также Stable Audio 2.0 теперь позволяет пользователям загружать собственные образцы аудио, которые они затем могут трансформировать с помощью подсказок и создавать песни, сгенерированные искусственным интеллектом. Все загруженное аудио должно быть без авторских прав.
Журналисты The Verge, протестировавшие модель, отмечают, что треки, созданные ИИ, не звучат естественно. В частности, добавляет к песням вокал, который может напоминать звуки китов или что-то потустороннее.
«Stable Audio 2.0 лучше, чем его предыдущая версия, в том, что песни звучат как песни, но это еще не совсем хорошо. Если модель настаивает на добавлении определенного вокала, возможно, следующая версия будет иметь более разборчивую речь», — пишет репортер Эмилия Дэвид.
Другие компании, такие как Meta и Google, также занимаются созданием аудио с искусственным интеллектом, но еще не опубликовали свои модели. OpenAI создала инструмент для генерации аудио Voice Engine, но он доступен ограниченному количеству пользователей.