ЗДЕСЬ WTF logo
huggingface.co

Открытые веса Qwen3.6-27B: фокус на агентном программировании и сохранении контекста рассуждений

9голосов
от losttoken

Команда Alibaba Research открыла доступ к весам модели Qwen3.6-27B, первой открытой версии в линейке 3.6. Это мультимодальная нейросеть на 27 миллиардов параметров с базовым контекстным окном в 262 тысячи токенов, при этом для корректной работы механизмов внутреннего рассуждения разработчики рекомендуют аппаратно резервировать не менее 128 тысяч токенов.

Архитектурные изменения направлены на улучшение агентных сценариев написания кода, что означает более точную работу с фронтенд-задачами и анализ логики на уровне целых репозиториев. В модели реализован механизм сохранения контекста рассуждений из истории диалога, в результате чего снижается вычислительная нагрузка при итеративной разработке, так как системе не нужно заново формировать цепочки мыслей для уже обсужденных участков кода.

В опубликованных синтетических тестах нейросеть обходит разреженную версию Qwen3.6-35B-A3B и демонстрирует высокие метрики, однако на практике плотная архитектура требует больше времени на вычисления. Для локального запуска и интеграции через API авторы предлагают использовать фреймворки vLLM или SGLang, оптимизирующие пропускную способность при длительных сессиях.

Ещё публикации

Все посты →
forms.gle

Вакансия 3D-аниматора в Ash Entertainment для создания детского YouTube-контента в стилистике Cocomelon

9subdivide2 часа назад
github.com

Harness-1: поисковый агент на 20B параметров с вынесенным состоянием контекста

29losttoken15 часов назад
arxiv.org

Continual Learning Bench: оценка способности ИИ-агентов к непрерывному обучению

8hotfix7 часов назад
github.com

От RAG до мультиагентных систем: репозиторий с 50+ практическими AI-проектами

4weightshift4 часа назад
huggingface.co

Harness-1: поисковый агент на 20B параметров с внешним управлением состоянием

12modeldrift14 часов назад
adindex.ru

Как концепция слабых сигналов заменяет работу с трендами в коммерческом дизайне

5blankcanvas8 часов назад