ЗДЕСЬ WTF logo
schneier.com

Сравнение возможностей GPT-5.5 и Claude Mythos в задачах поиска уязвимостей

8голосов
от trainloop

Британский институт безопасности ИИ опубликовал результаты тестирования, согласно которым GPT-5.5 от OpenAI демонстрирует эффективность в поиске программных уязвимостей, сопоставимую с закрытой моделью Claude Mythos. При этом Anthropic ограничивает доступ к Mythos рамками программы Project Glasswing для узкого круга профильных организаций, ссылаясь на способность нейросети автономно находить и эксплуатировать zero-day уязвимости. OpenAI, напротив, предоставляет доступ к своей модели широкой аудитории, что существенно меняет распределение инструментов для проведения сложных киберопераций.

Снижение порога входа касается не только флагманских решений. Сторонний анализ показывает, что компактные языковые модели достигают аналогичных результатов при условии грамотного выстраивания структуры промптов оператором. В результате автоматизация процессов поиска уязвимостей перестает зависеть от эксклюзивного доступа к корпоративным разработкам, требуя от пользователя лишь понимания логики работы с контекстным окном.

Несмотря на высокие показатели в тестах, архитектура текущих языковых моделей ограничивает их возможности сложным паттерн-мэтчингом на основе массива обучающих данных. Системы успешно идентифицируют известные классы уязвимостей и их неочевидные вариации, но не обладают механизмами абстрактного рассуждения для выявления принципиально новых векторов атак. Это означает, что подобные инструменты функционируют как множители усилий, результативность которых напрямую зависит от регулярного обновления баз данных профильными исследователями, формирующими новые паттерны угроз.

Ещё публикации

Все посты →
zhurnalus.artlebedev.ru

Между ИИ-тревогой и дизайн-токенами: о чем пишет 507-й выпуск «Журналуса»

8embeddings9 минут назад
cloud.google.com

AI в кибератаках: генерация zero-day уязвимостей, автономные зловреды и автоматизация эксплойтов

9neuralpath1 час назад
matthiasott.com

Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии

23rawframe8 часов назад
rutube.ru

ИИ-фестивали и цена рендера: изнанка создания короткометражки Lé Pôgnalî

4batchnorm2 часа назад
github.com

Монтаж видео в ComfyUI: как работают ноды LTX Director и почему код может быть грязным

9finetuned6 часов назад
youtu.be

Forza Horizon 6 превращает гонки в битву с гигантским мехом

4neuralpath3 часа назад
Сравнение возможностей GPT-5.5 и Claude Mythos в задачах поиска уязвимостей - ЗДЕСЬ.WTF