Они сломали интернет? Как работают алгоритмы TikTok — расследование NYT
IT-индустрия30 декабря 2021, 07:03
TikTok — самая быстрорастущая на данный момент соцсеть. Еще в сентябре ее пользователем был практически каждый седьмой житель Земли — количество людей, которые смотрят короткие залипательные видео в китайском приложении перевалило за миллиард. И это всего лишь за пять лет работы.
Благодарить за это стоит успешную модель приложения — достаточно простое создание контента и чрезвычайно точная работа алгоритмов, которые подбирают, какое видео показывать пользователям.
С первым все достаточно просто: человек открывает приложение, получает фоновую музыку и делает буквально что угодно — открывает рот под «песню», танцует или догружает любое не свое видео.
А вот второе намного интереснее. Для человека, который исключительно потребляет контент и не создает ничего своего, приложение разработало мощные алгоритмы, которые идеально подсаживают его на крючок. Причем приложению абсолютно все равно, чем человек интересуется — технологиями, лыжным спортом, мемами, Бритни Спирс или рыбалкой — уютный уголок с подходящим контентом найдет для себя каждый.
Как именно TikTok стал таким популярным? По каким принципам работает самое успешное видео-приложение в мире? Как оно подбирает именно тот контент, который заставит вас посмотреть «еще одно видео» и не закрывать программу?
Подпишитесь на NV Премиум и читайте без ограничений
Нам необходима ваша поддержка, чтобы заниматься качественной журналистикой
В распоряжении The New York Times оказался внутренний документ компании, который объясняет, как работют алгоритмы, подбирающие, что именно вы будете смотреть. Его подлинность подтвердила глава коммуникационного отдела платформы Хилари Маккуэйд. Сам документ был написан, чтобы объяснить сотрудникам-неспециалистам работу алгоритмов TikTok. НВ выбрал главное из материала NYT.
Документ на самом деле показывает, что TikTok не разрабатывал какую-то сверхуникальную формулу алгоритмов, как это часто представляется со стороны. Модели их работы действительно могут быть сложными, однако сама система рекоммендаций на самом деле работает, основываясь на вполне понятных понятных критериях, понятных большинству пользователей интернета.
В основе работы алгоритма лежит формула, которая и определяет, какое именно видео увидит пользователь. Предсказания искусственного интеллекта и настоящее поведение пользователя суммируются на основе четырех типов данных: лайк, комментарий, время просмотра и сам факт включение/пропуска видео.
Причем время, затраченное на просмотр видео — едва ли не главный показатель, на который опирается алгоритм. Так он определяет, какой тип видео вам нравится, чтобы «направить пользователя к еще большему количеству роликов, который заставят его и дальше скроллить приложение». Этот процесс может привести к опасным кроличьим норам, со временем начав показывать пользователю суицидальный контент. Администрация TikTok, к слову, отмечает, что планирует агрессивно бороться с подобными и другими видео, которые нарушают правила платформы.
«Система работает так, что ключевым компонентом является время просмотра. Алгоритм пытается вызвать у людей зависимость, а не дать им то, что они действительно хотят. Мне кажется безумным позволить алгоритму TikTok управлять жизнью наших детей. Каждое видео, которое смотрит ребенок, дает TikTok информацию о нем», — говорит Гийом Часло, основатель Algo Transparency, фонда, который изучает алгоритмы еще одного видеосервиса — Youtube.
«За несколько часов алгоритм может определить его музыкальные вкусы, его физическое влечение, депрессию, пристрастие к наркотикам и другую конфиденциальную информацию. Существует высокий риск того, что часть этой информации будет использована против него — например, для микро-таргетинга или увеличения его зависимости от платформы», — отмечает он.
TikTok работает как на удержание пользователя — чтобы он из раза в раз заходил в приложение — так и на «потраченное время» — чтобы пользователь проводил на платформе как можно больше времени. Для этого алгоритмы соцсети работают на разнообразие контента, не предлагая человеку одну и ту же тему.
«Если пользователю нравится определенная тематика видео, однако приложение будет и дальше предлагать ему такие же, ему быстро станет скучно, и он закроет приложение… повторяемость приводит к скуке», — гласит документ. Чтобы бороться с этим, алгоритмы навязывают «принудительную рекомендацию», показывая пользователям контент другой тематики, однако набирающий относительно высокие баллы по внутренней формуле.
Еще одна приметка в документе указывает, что одной из целей компании является «монетизация для авторов» — соответственно, такие видео TikTok будет предлагать чаще, ведь они не просто развлекают пользователя, но еще и приносят прибыль создателям контента и, как следствие, самой платформе.
Еще один вопрос, который заинтересовал издание — может ли китайское правительство использовать платформу для распространения пропаганды, как это было в случае с цензурой видео, осуждающего массовые задержания мусульман в Китае. К примеру, хештег #whereispengshua, отсылающий к китайской теннисистке, обвинившей одного из представителей правительства в изнасиловании, существует в системе, однако все видео по теме имеют очень мало просмотров. Документ не дает ответа на вопрос, «сломан» ли поиск подобных видео.
- Новая теория заговора: Интернет умер несколько лет назад, а практически все, что нас окружает теперь — боты и нейросети
- Зумеры используют компьютеры не так, как вы. Почему это важно — и разве это плохо?
- Бывший директор Google сравнил искусственный интеллект с ядерным оружием. Вот почему нам стоит относиться к этому серьезно