Довше, але не краще. Аудіогенератор Stable Audio навчили створювати трихвилинні треки
Stability AI випустила нову версію аудіогенератора зі штучним інтелектом Stable Audio, яка дозволяє користувачам створювати пісні тривалістю три хвилини.
Перша версія Stable Audio була випущена у вересні 2023 року та пропонувала створення треків тривалістю лише до 90 секунд для деяких платних користувачів. Друга версія моделі значно розширює можливості користувачів.
«Stable Audio 2.0 дозволяє відтворювати високоякісні, повні треки з узгодженою музичною структурою тривалістю до трьох хвилин зі стереозвуком 44,1 кГц з однієї підказки природною мовою», — інформує Stability AI у своєму блозі.
Stability AI зробила нову модель безплатною і загальнодоступною через свій вебсайт. Stable Audio 2.0 тепер дозволяє користувачам завантажувати власні зразки аудіо, які вони потім можуть трансформувати за допомогою підказок і створювати пісні, згенеровані штучним інтелектом. Усе завантажене аудіо має бути без авторських прав.
Журналісти The Verge, як протестували модель, зауважують, що треки, створені ШІ, не звучать природно. Зокрема, додає до пісень вокал, який може нагадувати звуки китів чи щось потойбічне.
«Stable Audio 2.0 краще, ніж його попередня версія, у тому, що пісні звучать як пісні, але це ще не зовсім добре. Якщо модель наполягає на додаванні певного вокалу, можливо, наступна версія матиме більш розбірливу мову», — пише репортерка Емілія Девід.
Інші компанії, як-от Meta та Google, також займаються створенням аудіо зі штучним інтелектом, але ще не опублікували свої моделі. OpenAI створила інструмент для генерації аудіо Voice Engine, але він доступний обмеженій кількості користувачів.