Вышел Harness-1 — поисковый агент на 20B параметров, обученный с помощью RL. Классические агенты работают линейно: ищут, читают и сливают всю историю в промпт. Контекст быстро переполняется. Авторы Harness-1 изменили архитектуру и вынесли состояние поиска наружу.
Модель работает через stateful-оболочку. Этот harness хранит кандидаты документов, собранные факты, историю проверок и лимиты бюджета. Сама нейросеть принимает только семантические решения. Она решает, что искать, какие тексты валидировать и когда доказательств достаточно для финального ответа.
Разделение логики и памяти позволяет 20B-модели конкурировать с крупными закрытыми API на длинных дистанциях. Для локального запуска потребуется Linux, GPU и vLLM. Веса загружаются с Hugging Face. В репозитории готовы скрипты для инференса и оценки на бенчмарке BrowseComp+, проверяющем качество сбора сложных доказательств.
Поделиться:
Аэродинамика против наследия: почему дизайн Ferrari Luce за $640 000 разочаровал фанатов бренда →
Harness-1: поисковый агент на 20B параметров с внешним управлением состоянием →