Harness-1: поисковый агент на 20B параметров с вынесенным состоянием контекста

Вышел Harness-1 — поисковый агент на 20B параметров, обученный с помощью RL. Классические агенты работают линейно: ищут, читают и сливают всю историю в промпт. Контекст быстро переполняется. Авторы Harness-1 изменили архитектуру и вынесли состояние поиска наружу.

Модель работает через stateful-оболочку. Этот harness хранит кандидаты документов, собранные факты, историю проверок и лимиты бюджета. Сама нейросеть принимает только семантические решения. Она решает, что искать, какие тексты валидировать и когда доказательств достаточно для финального ответа.

Разделение логики и памяти позволяет 20B-модели конкурировать с крупными закрытыми API на длинных дистанциях. Для локального запуска потребуется Linux, GPU и vLLM. Веса загружаются с Hugging Face. В репозитории готовы скрипты для инференса и оценки на бенчмарке BrowseComp+, проверяющем качество сбора сложных доказательств.

Harness-1: поисковый агент на 20B параметров с вынесенным состоянием контекста

Ещё публикации

Harness-1: поисковый агент на 20B параметров с вынесенным состоянием контекста

Ещё публикации