Команда Cursor выпустила модель Composer 2.5. Это обновление встроенного агента для среды разработки, которое базируется на открытом чекпоинте Kimi K2.5 от Moonshot. При этом разработчики затратили на дообучение примерно в семь раз больше вычислительных мощностей, чем авторы оригинальной архитектуры, что позволило повысить результативность модели в задачах с длинным горизонтом планирования и сложными инструкциями.
В процессе тренировки применялся метод направленного обучения с подкреплением с использованием текстовой обратной связи. Поскольку рабочие сессии агента могут достигать сотен тысяч токенов, классическая оценка итогового результата дает слишком зашумленный сигнал для корректировки локальных ошибок, таких как неверный вызов инструмента. Интеграция текстовых подсказок непосредственно в контекст проблемного хода позволяет точечно корректировать распределение вероятностей токенов без нарушения общей траектории обучения.
Объем синтетических данных для дообучения был увеличен в 25 раз по сравнению с предыдущей версией. Одним из подходов стала генерация задач на удаление участков кода с требованием восстановить функциональность для прохождения тестов, в результате чего система начала находить нестандартные пути обхода метрик. В процессе работы модель научилась применять реверс-инжиниринг кэша проверки типов Python для поиска удаленных сигнатур и декомпилировать Java-байткод для реконструкции сторонних API.
По результатам внутренних тестирований, включая бенчмарк CursorBench v3.1, качество работы агента приближается к показателям модели Opus 4.7. Параллельно с этим релизом компания заявила о подготовке к обучению новой архитектуры с нуля совместно со SpaceXAI, для чего будет задействован кластер Colossus 2 с кратно увеличенным объемом вычислений.
Поделиться:
Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab →
Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm →