Не оправдывает ожиданий? Пользователи показали уродливые ролики, которые генерирует платный ИИ от OpenAI

IT-индустрия

12 декабря 2024, 19:15

Разрекламированная модель искусственного интеллекта от OpenAI, способная генерировать видео в высоком разрешении только по текстовым подсказкам, стала доступной для пользователей, и ее первые результаты неприятно удивляют.

На этой неделе OpenAI наконец сделала доступным свой видеогенератор с искусственным интеллектом Sora. Пока инструмент платный, и полноценный доступ можно получить только по подписке за 200 долларов в месяц. Пользователи начинают активно делиться в соцсетях результатами испытаний модели, релиза которой ждали более полугода.

Один из юзеров выяснил, что если видео с людьми длятся не 5 секунд, а 10, то люди в кадре совсем перестают выглядеть естественно.

Another attempt at "two men shaking hands", this time I asked for 10 seconds instead of 5 seconds. 10 seconds is too long to ask Sora to keep things looking physically plausible, it seems.

[image or embed]

— Colin (@colin-fraser.net) 12 грудня 2024 р. о 00:00

Также было выяснено, что некоторые запросы Sora просто не может выполнить без ошибок. Одним из таких оказался сюжет о том, как человек задувает свечу. В кадре и свеча, и человек, выглядят странно. Не меньше проблем и с запросами на видео, в которых человек берет из коробки кусок пиццы и уходит.

"a person blows out all the candles on a birthday cake"

[image or embed]

— Colin (@colin-fraser.net) 12 грудня 2024 р. о 00:00

"A full pizza sits in an open pizza box on the counter. A person takes a slice and walks out of the frame."

[image or embed]

— Colin (@colin-fraser.net) 12 грудня 2024 р. о 00:34

Кроме того, тестирование показало, что видеогенератор очень часто игнорирует целые части текстовых подсказок. Так, на просьбу изобразить, как человек допивает стакан апельсинового сока, оставляя стакан пустым, можно получить результат, где человек со стаканом не шевелится.

"a person finishes a glass of orange juice, leaving the glass empty"

[image or embed]

— Colin (@colin-fraser.net) 12 грудня 2024 р. о 00:00

Проблемы были и с изображениями того, как человек что-то делает руками — собирает кубик Рубика или разрывает лист бумаги.


"a person tears a sheet of paper in half and drops the two pieces, which fall to the floor"

[image or embed]

— Colin (@colin-fraser.net) 12 грудня 2024 р. о 00:00

Другие новости

Все новости