Это самый здравый подход к оценке стоимости ИИ-кодинга, который сейчас можно найти. Корпорации в панике отключают автокомплиты из-за космических трат. CTO Uber сжег годовой ИИ-бюджет за один квартал. Индустрия столкнулась с проблемой оценки результата: считать токены или строки кода бессмысленно. Механический рефакторинг набивает тысячи строк за секунды. Поиск плавающего бага на две строчки требует часов сложного дебага.
Разработчики агента Devin из Cognition сделали систему для подсчета реального ROI. Они перешли к классической метрике человеко-часов. Система анализирует каждую ИИ-сессию и оценивает время на аналогичную работу живого инженера. Сначала модель жестко фильтрует мусор. Если агент не смог слить PR или завис на вопросах, часы не засчитываются. Затем алгоритм разбирает контекст. Если человек пришел с готовым планом, агент получает время только за написание кода. Принес пустой баг-репорт — плюсуется время на расследование.
Сильнее всего впечатляет работа с контекстом кодовой базы. Агенты часто ковыряют незнакомое легаси. Живому разработчику потребовался бы день на изучение архитектуры. Оценщик учитывает это время на онбординг в проекте. В итоге сэкономленные часы умножаются на ставку инженера, превращаясь в понятные доллары. Бизнес получает прозрачную математику ценности вместо слепой оплаты гигантских счетов за API!
Поделиться:
Автономный поиск уязвимостей и ревью кода: пайплайны от Anthropic и Alibaba →
Агентная модель на 550B параметров: что скрывает архитектурный гибрид NVIDIA Nemotron 3 Ultra →