Утечка на 500 тысяч строк. Как Anthropic случайно раскрыла собственный исходный код и что в нем нашли

IT-индустрия

1 апреля, 17:20

После обновления ИИ-помощника Claude Code в руки пользователей попали внутренние файлы компании Anthropic. Народные умельцы уже откопали в них ряд невыпущенных функций.

Как произошла утечка

Обновление инструмента для кодирования Claude Code загрузили в общедоступный реестр пакетов для разработчиков 31 марта. Там случайно оказался так называемый debugging file для отладки программы. Этот файл содержал ссылку на zip-архив в собственном облачном хранилище Anthropic.

Утечку быстро заметил исследователь по кибербезопасности Чаофан Шоу. Он опубликовал ссылку на загрузку кодовой базы в соцсети X. И за считанные часы код разлетелся для анализа на GitHub, платформе для разработчиков со всего мира.

Как пишет The Verge, масштабы утечки Anthropic оцениваются в примерно 512 тысяч строк кода на языке TypeScript в 1900 файлах.

В тот же день, 31 марта, представитель Anthropic разослал западной прессе официальный комментарий: «Сегодня в релиз Claude Code попал определенный внутренний исходный код. Никаких конфиденциальных данных клиентов или учетных данных не было задето или раскрыто».

Спикер компании утверждает, что сбой в упаковке релиза стал следствием человеческой ошибки, и вмешательств в систему безопасности не было. «Мы внедряем меры, чтобы предотвратить такое в будущем».

Слитые данные касаются исключительно самой программы Claude Code, а не базовых моделей искусственного интеллекта Anthropic, отмечает издание Business Insider. Впрочем, и такая находка заинтересовала публику, ведь Claude Code является одним из самых известных коммерческих продуктов компании. Утечка уже позволила всем желающим рассмотреть, как Anthropic собирает готового к рынку ИИ-агента и как тот выполняет инструкции.

Что нашли в файлах кода

Среди ключевых находок — внутренние данные разработчиков Anthropic по производительности и неанонсированные функции. В частности, система, которая позволяет ИИ анализировать предыдущие сессии и учитывать этот опыт в новых диалогах, а также возможность удаленного управления Claude со смартфона или другого браузера.

The Verge добавляет, что в коде нашли упоминания о постоянно активном агенте под названием KAIROS, который работает в фоновом режиме круглосуточно. AI-предприниматель Оле Леманн описывает его как всегда включенного, проактивного Claude, который «делает вещи без вашей просьбы».

«Каждые несколько секунд KAIROS получает сигнал вроде: „Есть ли что-то, что стоит сделать именно сейчас?“ Он анализирует ситуацию и принимает решение: действовать или оставаться в покое. Если он решает действовать, то может исправлять ошибки в вашем коде, отвечать на сообщения, обновлять файлы, выполнять задачи. В общем, все то, что уже умеет делать Claude Code, только без ваших указаний», — объясняет Леманн в X.

Упоминания о KAIROS в файлах Anthropic / Фото: itsolelehmann/X

В анонимной заметке на Reddit также упоминается функция тамагочи, якобы приуроченная ко Дню смеха 1 апреля. Речь идет о «домашнем любимце», который «сидит возле вашего поля ввода и реагирует на ваш код».

«Когда вы вводите команду [/buddy], „вылупляется“ уникальный ASCII-спутник, созданного на основе вашего идентификатора пользователя, — говорится в публикации. — Есть 18 видов, среди которых утка, капибара, дракон, призрак, аксолотль и нечто под названием „чонк“».

Почему это плохо для Anthropic

Как отмечает издание Fortune, это уже второй случайный слив данных от Anthropic за последнее время. 26 марта компания ошибочно открыла доступ к почти 3 тысячам файлов. Там нашли черновик публикации о новой ИИ-модели, которая фигурирует под внутренними названиями Mythos и Capybara.

Очередная невнимательность может подорвать репутацию Anthropic, которая стабильно выстраивает свой маркетинг вокруг темы надежности. К примеру, в прошлом году агентство Reuters сообщало, что компания активно освещала собственные усилия по блокированию хакеров, которые пытались использовать Claude для фишинга, создания вредоносных программ и других киберпреступлений.

«Обычно крупные компании имеют строгие процедуры и многоуровневые проверки перед тем, как код попадает в продакшн. Это как сейф, для открытия которого нужно несколько ключей», — объясняет старший исследователь безопасности ИИ из LayerX Security Рой Паз.

«В Anthropic, похоже, этого процесса не было, и единственная неправильная конфигурация или ошибочный клик внезапно раскрыли весь исходный код».

До сих пор СМИ не сообщали об утечке клиентских данных, паролей и т. д., поэтому худшего сценария Anthropic пока избежала. Однако компания уже фактически подарила конкурентам и обычным юзерам внутреннюю информацию о дизайне своего продукта. И произошел этот провал именно в то время, когда Anthropic убеждает бизнес доверять ее ИИ-агентам более конфиденциальные задачи.

Другие новости

Все новости