News

AI-помощник как троянский конь: уязвимость в Claude открыла ящик Пандоры

В инструментах Anthropic Claude нашли критическую уязвимость, позволявшую удаленно выполнять код. Как AI-ассистенты становятся новой целью для хакеров.

Евгений Тишин

26 февр. 2026 — 2 min read

Пока маркетологи Anthropic распевают осанны новому дивному миру AI-разработки, суровая реальность вносит свои коррективы. В инструментах для совместной работы Claude была обнаружена критическая уязвимость, которая, по сути, превращала хваленого AI-ассистента в широко открытую дверь для хакеров. Исследователи из Oligo Security продемонстрировали, как через специально подготовленный проект можно было добиться удаленного выполнения кода (RCE) на машине ничего не подозревающего разработчика. Проще говоря, ваш умный помощник по написанию кода мог в любой момент стать послушным исполнителем чужой воли и слить ваши API-ключи или установить бэкдор.

Механика атаки до боли изящна и напоминает классическую социальную инженерию, только на стероидах и с поправкой на AI. Злоумышленник создает публичный репозиторий, например, на GitHub, маскируя его под полезную библиотеку или интересный проект. Внутрь он закладывает «мину» — вредоносные конфигурации в служебных файлах проекта (вроде .vscode/settings.json). Эти конфиги содержат инструкции, которые при открытии проекта в редакторе кода (например, VS Code) заставляют расширение Claude выполнить произвольную команду в терминале. Разработчик, заинтересовавшись проектом, клонирует репозиторий, открывает его... и всё. AI-помощник, стремясь «помочь» настроить окружение, без лишних вопросов исполняет заложенный скрипт. Результат — скомпрометированная система.

И вот здесь начинается самое интересное. Этот инцидент — не просто частная ошибка Anthropic, которую они, к их чести, оперативно исправили и выплатили вознаграждение нашедшим. Это — первый громкий звонок, анонсирующий целый новый класс уязвимостей, порожденных самим принципом работы современных AI-ассистентов. Мы так спешим наделить их самостоятельностью, дать им доступ к файловой системе, терминалу и сетевым подключениям, что забываем о базовой гигиене безопасности. Инструмент, который по определению должен иметь высокий уровень доверия и привилегий для эффективной работы, автоматически становится главной целью для атаки.

Эта история разворачивается на фоне ожесточенной гонки вооружений между техногигантами. Anthropic со своим Claude отчаянно пытается догнать и перегнать OpenAI с его экосистемой и GitHub Copilot, который уже де-факто стал стандартом для миллионов разработчиков. В этой гонке за фичи, скорость и «магию» AI вопросы безопасности часто отходят на второй план. Желание сделать ассистента максимально «умным» и автономным (чтобы он сам ставил зависимости, запускал тесты и настраивал проект) прямо конфликтует с необходимостью держать его в жестких рамках песочницы. Каждый новый уровень свободы для AI — это новый потенциальный вектор атаки.

По иронии судьбы, мы сами создаем идеального внутреннего агента для злоумышленников. Мы учим его быть проактивным, доверяем ему свои самые чувствительные данные и рабочие процессы. Атака на Claude — это лишь доказательство концепции. Что будет, когда подобные уязвимости найдут в более распространенных инструментах? Что случится, когда AI-агенты получат не просто доступ к терминалу, а права на развертывание инфраструктуры в облаке и управление корпоративными секретами? Мы стоим на пороге мира, где обмануть нужно будет не человека, а его слишком доверчивого кремниевого помощника, который не способен отличить легитимную команду от вредоносной.

Наш вердикт: Это не провал Anthropic, это — суровая реальность всей AI-индустрии. Мы получили наглядную демонстрацию того, что «умный» не значит «безопасный». Уязвимость в Claude — это не баг, а фича всей текущей парадигмы разработки AI-инструментов, где скорость важнее осмотрительности. Компании залатали конкретную дыру, но оставили открытым концептуальный шлюз. И пока гонка за «самым умным ассистентом» продолжается, разработчикам стоит помнить, что их новый лучший друг по программированию может оказаться троянским конем, которого они сами с радостью затащили в свою крепость.

AI-помощник как троянский конь: уязвимость в Claude открыла ящик Пандоры

Евгений Тишин

Read more

AWS обещает вдвое сократить расходы на инференс LLM с помощью умного кэширования

LLM убила звезду приватности. Мы не можем отмотать назад

ИИ-апокалипсис по расписанию: ChatGPT и Claude с радостью развязывают ядерную войну

Amazon и vLLM научились запускать десятки кастомных AI-моделей на одной GPU, сокращая расходы в разы