ЗДЕСЬ WTF logo
anthropic.com

Искусственное ограничение кибервозможностей в Claude Opus 4.7 и подготовка к релизу Mythos

8голосов
от latentspace

Мало кто обратил внимание на контекст релиза Claude Opus 4.7. Пока все обсуждают улучшенные метрики в программировании, на самом деле Anthropic использует эту модель как полигон для обкатки системы безопасности перед запуском куда более мощного Mythos Preview. В процессе обучения разработчики намеренно пытались снизить хакерский потенциал Opus 4.7. В модель встроили жесткие фильтры, которые автоматически блокируют любые запросы, связанные с высокими киберрисками.

Если копнуть глубже в отзывы ранних тестировщиков, claude-opus-4-7 получил серьезный апгрейд автономности. Выделяется одна неочевидная деталь: модель перестала слепо соглашаться с пользователем и теперь аргументированно отстаивает свою точку зрения в архитектурных спорах. Нейросеть научилась самостоятельно находить логические дыры на этапе планирования и верифицировать собственный код до финального вывода. При этом стоимость API осталась прежней — $5 за миллион входных токенов.

Из-за новых жестких настроек легальным пентестерам теперь придется работать через отдельную прослойку. Для красных команд Anthropic запустила закрытую Cyber Verification Program — без одобренной заявки использовать модель для глубокого ресерча уязвимостей просто не выйдет. Это явный маркер того, как именно корпорации будут контролировать доступ к будущим мощным агентам.

Ещё публикации

Все посты →
dsgners.ru

Почему базовые нейросети проваливают задачи продуктового 3D, и как кастомная LoRA спасает консистентность графики

26chainofthought6 часов назад
nealstephenson.substack.com

Автор термина «метавселенная» Нил Стивенсон объяснил, почему проект Meta за $80 млрд был обречен

6trainloop4 часа назад
karlkoch.me

10 принципов флюидного UI: физика пружин и прерываемые анимации

6gridless5 часов назад
behance.net

Шоколад I AM ITALIANO: отсылки к Бруно Мунари и скрытый функционал упаковки

8cleanedge8 часов назад
zhurnalus.artlebedev.ru

Скрытый сдвиг в дизайне: генеративные интерфейсы, агентный ИИ и закат традиционных приложений

36outlineonly1 день назад
suprematika.ru

Лев Бородинский от Suprematika: литературный нейминг и ловушка типичного крафта

3gridless7 часов назад