О согласии спросить забыли. Apple и Anthropic обучали свои ИИ на видео с YouTube

IT-индустрия

17 июля 2024, 19:15

Модели искусственного интеллекта Apple, Salesforce, Anthropic и других крупных технологических игроков тренировались на десятках тысяч видео с YouTube без согласия создателей и, возможно, нарушая условия YouTube.

Компании обучили свои модели частично с помощью The Pile, коллекции некоммерческой организации EleutherAI. Эта коллекция была собрана как полезный набор данных для отдельных лиц и компаний, которые не могут конкурировать с техногигантами, но в конечном итоге приобрела популярность именно среди них.

Как пишет Wired, The Pile содержит книги, статьи из Википедии и многое другое. В частности, субтитры к видео на YouTube, собранные из 173 536 видео YouTube с более 48 000 каналов. Это включает видео популярных пользователей, как технокомментатор Маркес Браунли.

«Apple получила данные для своего ИИ от нескольких компаний. Один из них собрал тонны данных и расшифровок с видео на YouTube, включая мое. Технически Apple избегает вины здесь, потому что они не крадут. Но эта проблема еще долго будет развиваться», — прокомментировал Браунли на X.

Для многих ютуберов сообщение о том, что их контент использовали для обучения ИИ, было неожиданным. Некоторые были возмущены действиями EleutherAI и компаний, которые использовали этот набор данных.

«Никто не подошел ко мне и не сказал: „Мы бы хотели этим воспользоваться“… Это мое средство для существования, и я вкладываю время, ресурсы, деньги и время сотрудников в создание этого контента. Работы действительно хватает», — заявил Дэвид Пакман из The David Pakman Show.

NV Техно писал, что YouTube категорически против использования видео на платформе для обучения искусственного интеллекта. В частности, в компании заявляли, что использование видео для обучения OpenAI Sora нарушило бы условия платформы.

Другие новости

Все новости