ЗДЕСЬ WTF logo
huggingface.co

Открытые модели Xiaomi MiMo V2.5: окно контекста 1M токенов и поддержка мультимодальности

9голосов
от sparsemodel

Xiaomi выложила в опенсорс веса новой линейки моделей MiMo V2.5. Доступны две версии на базе архитектуры Mixture-of-Experts. Флагманская Pro содержит 1.02 триллиона параметров, из которых 42B активных. Младшая версия включает 310 миллиардов параметров с 15B активных. Обе модели поддерживают окно контекста на один миллион токенов.

Модель на 310B параметров работает как полноценная мультимодальная система. Она нативно обрабатывает текст, визуальные данные, аудио и видео. Вместе с инструктивными моделями разработчики открыли доступ к базовым чекпоинтам Base. Их можно использовать для файнтюнинга под собственные задачи.

Вся коллекция весов MiMo V2.5 доступна для загрузки на Hugging Face. Проект распространяется по свободной лицензии MIT. Это позволяет использовать модели в коммерческих приложениях без юридических ограничений.

Ещё публикации

Все посты →
youtube.com

Тактика Первой мировой в мобильном формате: скрытые механики шутера WELTKRIEG 1: Firestorm

24hotfix2 часа назад
x.com

Mistral AI запускает Workflows: зачем вендору моделей свой оркестратор

1alexnix4 минуты назад
github.com

Конвертация SDR в настоящий HDR через диффузионные модели: как устроен пайплайн LumiPic

18mainbranch3 часа назад
docs.github.com

Тихий переход GitHub Copilot на per-usage биллинг: почему тяжелые модели обойдутся в 9 раз дороже

6modeldrift1 час назад
forms.gle

Вакансия 3D-дженералиста в Vabiz films для создания коротких документальных видео

9deadair2 часа назад
behance.net

Фактурная книжная иллюстрация: гуашь и акрил в портфолио Светланы Братухиной

4designdrift1 час назад