Команда Anthropic выпустила плагин security-guidance для своей среды разработки Claude Code. Инструмент заставляет нейросеть проверять собственные изменения на наличие уязвимостей в процессе работы, что позволяет устранять ошибки вроде инъекций или использования небезопасных API до создания pull request. При этом для анализа используется отдельный контекст, что означает независимую оценку написанного кода без привязки к изначальным решениям первой модели.
Проверка интегрирована в рабочий процесс через систему хуков и функционирует на трех уровнях с разной глубиной анализа. При каждом изменении файла плагин выполняет быстрый поиск опасных паттернов, таких как eval или dangerouslySetInnerHTML, без обращения к модели и дополнительных затрат на API. В конце каждого диалогового хода происходит фоновый анализ git diff с помощью отдельного вызова LLM, что выявляет сложные проблемы, включая обход авторизации или слабую криптографию. В результате модель получает замечания как системные инструкции и исправляет их следующим сообщением, не блокируя основной ответ пользователю.
Третий уровень защиты активируется при выполнении команд git commit или git push через встроенный инструмент Bash, запуская глубокий агентный анализ. На этом этапе система самостоятельно изучает окружающий контекст, включая вызывающие функции и связанные файлы, что снижает количество ложных срабатываний на безопасных участках кодовой базы. Разработчики могут расширять базовый функционал, добавляя собственные проверки через Markdown-инструкции для модели или YAML-словари для паттернов.
Поделиться:
Как Stripe использует платформу Protodash для генерации интерфейсов через Cursor и Claude →
Blurple slop: почему Stripe отказались от публичных ИИ-генераторов UI и собрали свой Protodash →