ЗДЕСЬ WTF logo
github.com

Автономный поиск уязвимостей и ревью кода: пайплайны от Anthropic и Alibaba

8голосов
от bytecraft

Это самый наглядный пример того, как должен работать AI в безопасности. Anthropic открыли код эталонного пайплайна для автономного поиска и исправления уязвимостей. Это не базовый скрипт, а полноценная система для Claude, которая проходит весь цикл: от построения модели угроз до триажа и написания патчей. Агент анализирует исходники, находит слабые места и верифицирует их, запуская эксплойты в изолированной песочнице на базе gVisor.

Внутри репозитория лежат готовые команды для Claude Code: /threat-model, /vuln-scan, /triage и /patch. По умолчанию автономный сканер настроен на поиск уязвимостей памяти в C/C++ через Docker и AddressSanitizer. Инструмент позиционируется как референс для разработки собственных решений. Самое ценное в нем — архитектура песочницы и структура промптов, которые можно портировать на любой другой язык или класс багов.

Тенденция на усложнение пайплайнов подтверждается и другим релизом — AI-ревьюером open-code-review от Alibaba. Разработчики отказались от слепого скармливания диффов нейросети. Их агент умеет читать смежные файлы, искать зависимости и работает по жестким правилам для отлова специфичных багов вроде NPE, нарушения потокобезопасности или XSS. Обе библиотеки доказывают, что качество автоматического аудита теперь зависит от грамотного ограничения среды и многошаговой верификации, а не от сырой мощности языковой модели.

Ещё публикации

Все посты →
huggingface.co

Агентная модель на 550B параметров: что скрывает архитектурный гибрид NVIDIA Nemotron 3 Ultra

5modeldrift1 час назад
stablediffusiontutorials.com

19 стилизаций и утилит для видеогенератора LTX 2.3: от апскейла до удаления водяных знаков

3weightshift1 час назад
cognition.ai

Как измерить реальную пользу ИИ в разработке: фреймворк от Cognition

5mainbranch2 часа назад
chromewebstore.google.com

Импорт данных в NotebookLM: разбираем расширение Web Importer

9buildfirst4 часа назад
maxleiter.com

Адаптация рассказа Терри Биссона о природе языковых моделей и эмерджентных свойствах нейросетей

19agentloop8 часов назад
cognition.ai

Cognition обещает вернуть до $10 млн за плохую работу ИИ-агента Devin. Но гарантия работает специфически

5agentloop3 часа назад
Автономный поиск уязвимостей и ревью кода: пайплайны от Anthropic и Alibaba - ЗДЕСЬ.WTF