Как сообщает TechCrunch, на своем мероприятии Made on YouTube компания анонсировала Veo 3 Fast. Эта версия генерирует ролики с меньшей задержкой в разрешении 480p и впервые — со звуком. Пользователям позволяют бесплатно создавать фоны для видео или короткие ролики с помощью текстовых подсказок.
Более того: благодаря Veo 3 Fast пользователи смогут применять движения из видео к статическим изображениям — например, анимировать неподвижное изображение, заставив человека на нем танцевать с видео. Компания утверждает, что это возможно благодаря технологии, которая фиксирует и передает движение от одного объекта к другому.
Создатели также смогут использовать Veo для применения различных стилей к своим видео (поп-арт или оригами), и добавления объектов по текстовому описанию. Эти функции появятся в ближайшие месяцы.
Среди других новинок — инструмент Speech to Song, который превращает диалоги из видео в саундтреки. Идею функции объяснила Дина Беррада, директор YouTube по продуктам Shorts и генеративному ИИ:
«Как крупнейшая в мире творческая площадка, YouTube — это место, где рождаются тренды и где вы можете черпать вдохновение. Представьте, что вы услышали строчку диалога, которая вызвала идею — смешную фразу, памятную цитату или уникальный звук — и вы хотите превратить ее в новый саундтрек. С нашим новым инструментом ремикширования Speech to Song вы сможете сделать именно это».
Отмечается, что инструмент использует музыкальную ИИ-модель Google Lyria 2. Авторы смогут задавать настроение трека, выбирая такие варианты, как «спокойный» или «танцевальный».
Наконец, функция Edit with AI («Редактировать с помощью ИИ») анализирует необработанные кадры, автоматически находит лучшие моменты, добавляет музыку, переходы и даже закадровый голос, реагирующий на события в видео (пока что на английском или хинди). Цель — предоставить авторам готовый черновик для дальнейшего монтажа.
Обновление уже доступно в США, Канаде, Австралии и Новой Зеландии, с «планами расширения в будущем».