Залаштунки роботизації. Як хітова нейромережа ChatGPT пов’язана з експлуатацією людей у Кенії
IT-індустрія20 січня 2023, 07:07
Платформи для створення контенту за допомогою штучного інтелекту (AIGC) стали справжнім хітом останнім часом.
Подібні технології відкривають багато перспектив у плані роботизації креативних індустрій, але несуть не менше загроз для суспільства.
Взірцем сьогодення стала мовна модель ChatGPT, розроблена компанією OpenAI, одним з інвесторів якої був Ілон Маск.
«Текстовий робот» ChatGPT може імітувати живу мову, вести розмову практично на будь-яку тему та замінювати багато інформаційних сервісів, включно з пошуковими платформами, агрегаторами новин
Навчаючись на відкритих масивах даних з інтернету, ChatGPT та інші AIGC-платформи становлять величезну небезпеку з точки зору авторського права та інших форм захисту контенту від плагіату, посилення морально-етичних проблем і навіть позбавлення користувачів критичного мислення.
Згідно з новим розслідуванням журналістів TIME, для вирішення деяких з цих проблем менеджери OpenAI залучали фрілансерів з Кенії. Але вийшло лише гірше.
Передплатіть NV Преміум та читайте без обмежень
Нам необхідна ваша підтримка, щоб займатися якісною журналістикою
IT-галери
Після успіху ChatGPT компанію OpenAI оцінили у $29 млрд, і найближчим часом представники Microsoft планували інвестувати ще $10 млрд у її розвиток.
Можливо, ця угода зірветься через значний скандал, який спалахнув після публікації розслідування TIME 18 січня.
Ключовий висновок роботи журналістів полягає у тому, що OpenAI використовував аутсорсингових кенійських розробників за зарплату менше $2 на годину, щоб зробити відповіді ChatGPT менш токсичними, прибрати з масивів даних для навчання приклади мови ворожнечі, розпалювання ненависті, сексуального насильства
«Щоб це зробити, OpenAI відправляв десятки тисяч фрагментів тексту аутсорсинговій фірмі у Кенії, починаючи з листопада 2021-го. Схоже, більша частина цього тексту була витягнута з темних куточків інтернету. Деякі з них докладно описували ситуації сексуального насильства над дітьми, зоофілії, вбивств, самогубств, тортур та інцесту», 一 пише одна з авторів розслідування Джулія Зортіан.
Фрілансери з Кенії шукали маркери такого контенту для створення інструментів фільтрації, які не допускали формування відповідей ChatGPT з «токсичним текстом».
Посередником OpenAI виступила каліфорнійська аутсорсингова компанія Sama, яка наймає співробітників у Кенії, Уганді та Індії для техногігантів, враховуючи Google, Meta, Microsoft та інші. На сайті Sama вказано, що їхня команда використовує «міць ринків для суспільного блага», і вже допомогла більш ніж 50 тис. користувачам по всьому світу.
Однак, за даними TIME, маркувальники даних, найняті Sama від імені OpenAI, отримували заробітну плату у розмірі від $1,32 до $2 за годину, залежно від стажу роботи та продуктивності. Про це свідчать внутрішні документи Sama та OpenAI, які опинилися у розпорядженні журналістів, а також анонімні інтерв'ю співробітників цих компаній.
Представники OpenAI підтвердили, що співробітники Кенії «зробили свій внесок у створення інструменту для класифікації та фільтрації шкідливого тексту та зображень».
Один із цих співробітників розповів TIME, що страждав від повторюваних видінь після прочитання графічного опису того, як чоловік займався сексом із собакою у присутності маленької дитини. Ймовірно, такий характер роботи призвів до того, що Sama завершила співпрацю з OpenAI на вісім місяців раніше, ніж планувалося.
Обсяг роботи та припинення співпраці
Відомо, що кенійські фрілансери обробляли близько 150−250 фрагментів тексту розміром від 100 до понад 1000 слів за дев’ятигодинну зміну. TIME дізнався як мінімум про кілька випадків, коли така робота травмувала людей, і вони були змушені звертатися за медичною допомогою.
Хоча представник Sama заявив, що у всіх фрілансерів був доступ не лише до групових, а й до індивідуальних занять з «професійно підготовленими та ліцензованими психотерапевтами».
У компанії також підтвердили, що наймолодші фахівці з маркування даних отримували базову зарплату у розмірі 21 тис. кенійських шилінгів ($170) на місяць. Через морально складний характер роботи вони могли отримувати до $70 надбавки. При цьому вартість трьох контрактів, укладених між OpenAI і Sama, становила близько $200 тис.
Паралельно, підрядники з Sama почали збирати зображення сексуального характеру та інший контент 18+ для окремого проекту OpenAI, не пов’язаного з ChatGPT.
Компанії розробили окреме маркування цих зображень: C4 一 сексуальне насильство з дітей; C3 一 зоофілія, згвалтування та сексуальне рабство; V3 一 графічні деталі смерті, насильства чи серйозних тілесних ушкоджень
В OpenAI пояснили, що маркування шкідливих зображень є «необхідним кроком» для підвищення безпеки її інструментів ШІ.
Повідомляється, що OpenAI отримала від Sama близько 1400 зображень у категоріях «C4, C3, C2, V3, V2 і V1». Пізніше компанія заявила, що не планувала збирати контент С4 (сексуальне насильство над дітьми), і їм не потрібні зображення такого роду.
Припинення співробітництва компаній у лютому 2022-го пояснили тим, що представники Sama не хотіли наражати своїх співробітників на психологічні ризики, пов’язані з обробкою такого контенту.
Після серії розслідувань TIME, опублікованих у 2022-му та 2023-му, низка компаній, враховуючи німецького авіаперевізника Lufthansa, почали видаляти докази будь-якої співпраці з аутсорсинговою платформою Sama.
У січні 2023-го представники Sama заявили, що більше не працюватимуть із токсичним контентом. Це включає розірвання контракту з Facebook на суму близько $3,9 млн і втрату приблизно 200 робочих місць для співробітників у Найробі.