Монстр Цукерберга. Новий потужний штучний інтелект можуть навчити на наших дописах у Facebook та Instagram
Інновації7 лютого 2024, 06:05
Цукерберг оголосив про план Meta після оприлюднення останнього звіту щодо прибутків компанії, повідомляє Bloomberg. Гендиректор відзначив зростання платформ Facebook та Instagram та оцінив масив даних, який вони генерують.
«У Facebook і Instagram є сотні мільярдів публічних зображень і десятки мільярдів публічних відео, яких, за нашими оцінками, є більшими за набір даних Common Crawl, і люди також діляться великою кількістю публічних текстових публікацій у коментарях у наших службах», — зауважив він.
За твердженнями Цукерберга, його компанія має більше даних користувачів, ніж було використано для навчання надпопулярного чат-бота ChatGPT. Common Crawl, що вміщує дані з 250 мільярдів вебсторінок, був основною частиною того, на чому OpenAI навчала свою модель. Bloomberg зауважує, що на ринку ШІ перевагу Meta може дати не лише величезний обсяг даних, а й те, що значна їх частина є інтерактивною.
«Ця купа даних … є особливо цінною, оскільки велика її частина надходить із потоків коментарів. Будь-який текст, який представляє людський діалог, має вирішальне значення для навчання так званих розмовних агентів. Тому OpenAI інтенсивно використовувала інтернет-форум Reddit, щоб створити власного популярного чат-бота», — йдеться в статті видання.
Потенційне використання даних з Facebook та Instagram для створення потужного штучного інтелекту загального призначення викликає широке занепокоєння, оскільки постають питання щодо конфіденційності користувачів платформ Meta. Також хвилювання викликає токсичності вмісту, який використовуватимуть для навчання ШІ, оскільки в коментарях на Facebook та Instagram можна зустріти чимало расистських та сексистських і просто образливих реплік.
- Жахлива помилка. Генератори зображень з ШІ навчали на порноматеріалах з дітьми — дослідження
- Оце так прогалина. Лазівка в ШІ від Microsoft дозволяла створювати фейковий порноконтент з Тейлор Свіфт, її закрили
- Прихована вразливість. Інженер Microsoft заявив, що його змусили замовчувати загрозу діпфейків в DALL-E 3