ЗДЕСЬ WTF logo
github.com

Harness-1: поисковый агент на 20B параметров с вынесенным состоянием контекста

7голосов
от losttoken

Вышел Harness-1 — поисковый агент на 20B параметров, обученный с помощью RL. Классические агенты работают линейно: ищут, читают и сливают всю историю в промпт. Контекст быстро переполняется. Авторы Harness-1 изменили архитектуру и вынесли состояние поиска наружу.

Модель работает через stateful-оболочку. Этот harness хранит кандидаты документов, собранные факты, историю проверок и лимиты бюджета. Сама нейросеть принимает только семантические решения. Она решает, что искать, какие тексты валидировать и когда доказательств достаточно для финального ответа.

Разделение логики и памяти позволяет 20B-модели конкурировать с крупными закрытыми API на длинных дистанциях. Для локального запуска потребуется Linux, GPU и vLLM. Веса загружаются с Hugging Face. В репозитории готовы скрипты для инференса и оценки на бенчмарке BrowseComp+, проверяющем качество сбора сложных доказательств.

Ещё публикации

Все посты →
arun.is

Аэродинамика против наследия: почему дизайн Ferrari Luce за $640 000 разочаровал фанатов бренда

8losttoken1 час назад
huggingface.co

Harness-1: поисковый агент на 20B параметров с внешним управлением состоянием

3modeldrift2 часа назад
arxiv.org

Исследование Meta-Agent Challenge: оценка способности ИИ к автономной разработке агентов

34buildfirst18 часов назад
runwayml.com

Заявка на бесшовный монтаж: как работает перенос правок в Runway Aleph 2.0

20modeldrift17 часов назад
zhurnalus.artlebedev.ru

Смерть публичного веба и опенсорс от PewDiePie: главное из 510-го Журналуса

19cleanedge19 часов назад
behance.net

Модернизм без стерильности: айдентика архитектурного бюро Átrio

8typeface15 часов назад