Монстр Цукерберга. Новый мощный искусственный интеллект могут научить на наших постах в Facebook и Instagram
Инновации7 февраля 2024, 06:05
Цукерберг объявил о плане Meta после обнародования последнего отчета о прибыли компании, сообщает Bloomberg. Гендиректор отметил рост платформ Facebook и Instagram и оценил массив данных, который они генерируют.
«В Facebook и Instagram есть сотни миллиардов публичных изображений и десятки миллиардов публичных видео, которых, по нашим оценкам, больше, чем набор данных Common Crawl, и люди также делятся большим количеством публичных текстовых публикаций в комментариях в наших службах», — отметил он.
По утверждениям Цукерберга, его компания имеет больше данных пользователей, чем было использовано для обучения сверхпопулярного чат-бота ChatGPT. Common Crawl, содержащий данные из 250 миллиардов веб-страниц, был основной частью того, на чем OpenAI обучала свою модель. Bloomberg отмечает, что на рынке ИИ преимущество Meta может дать не только этот огромный объем данных, но и то, что большая их часть является интерактивной.
«Эта куча данных … по-особенному ценная, поскольку большая ее часть поступает из потоков комментариев. Любой текст, представляющий человеческий диалог, имеет решающее значение для обучения так называемых разговорных агентов. Поэтому OpenAI интенсивно использовала интернет-форум Reddit, чтобы создать собственного популярного чат-бота», — говорится в статье издания.
Потенциальное использование данных из Facebook и Instagram для создания мощного искусственного интеллекта общего назначения вызывает широкое беспокойство, поскольку возникают вопросы о конфиденциальности пользователей платформ Meta. Также волнение вызывает токсичность контента, который будут использовать для обучения ИИ, поскольку в комментариях на Facebook и Instagram можно встретить немало расистских и сексистских и просто оскорбительных реплик.
- Ужасная ошибка. Генераторы изображений с ИИ обучали на порноматериалах с детьми — исследование
- Вот так брешь. Лазейка в ИИ от Microsoft позволяла создавать фейковый порноконтент с Тейлор Свифт, ее закрыли
- Скрытая уязвимость. Инженер Microsoft заявил, что его заставили замалчивать угрозу дипфейков в DALL-E 3