Техногиганты использовали YouTube-видео для обучения ИИ / NV

Автор: Анастасия Печенюк

Модели искусственного интеллекта Apple, Salesforce, Anthropic и других крупных технологических игроков тренировались на десятках тысяч видео с YouTube без согласия создателей и, возможно, нарушая условия YouTube.

Компании обучили свои модели частично с помощью The Pile, коллекции некоммерческой организации EleutherAI. Эта коллекция была собрана как полезный набор данных для отдельных лиц и компаний, которые не могут конкурировать с техногигантами, но в конечном итоге приобрела популярность именно среди них.

Как пишет Wired, The Pile содержит книги, статьи из Википедии и многое другое. В частности, субтитры к видео на YouTube, собранные из 173 536 видео YouTube с более 48 000 каналов. Это включает видео популярных пользователей, как технокомментатор Маркес Браунли.

О согласии спросить забыли. Apple и Anthropic обучали свои ИИ на видео с YouTube