Perplexity попался. Почему искусственный интеллект обвиняют в краже данных и чем это грозит
ИИ-стартап Perplexity — в центре скандала: по отчету Cloudflare, он тайком собирает данные сайтов, которые запрещают сканирование. Ранее в подобном уже обвиняли OpenAI (ChatGPT) и Anthropic (Claude). Чем все это может обернуться для пользователей?
Действительно ли ИИ ворует контент
4 августа компания по интернет-безопасности Cloudflare обнародовала расследование с разоблачением действий Perplexity. Она создала тестовые веб-страницы, размещенные на доменах клиентов. Там содержались файлы robots.txt — этот инструмент сигнализирует поисковым системам «не сканировать» содержимое заданного сайта.
Сами же страницы были размещены так, чтобы ни один пользователь не мог их найти: они не имели никаких ссылок на другие ресурсы и не индексировались поисковыми системами. Несмотря на эти меры предосторожности, Perplexity все равно предоставлял подробную информацию о контенте на этих скрытых сайтах.