Добавить в избранное

Компания Mistral представила мультимодальную модель Mistral Medium 3.5 на 128B параметров с контекстным окном 256k токенов. Архитектура объединяет возможности рассуждения, генерации кода и следования инструкциям в едином наборе весов, при этом визуальный энкодер был обучен с нуля для работы с переменным размером изображений. Модель занимает промежуточную весовую нишу, уступая самым крупным открытым решениям, но позволяет осуществлять локальный деплой на четырех видеокартах. В результате для компенсации скорости генерации разработчики дополнительно опубликовали голову для спекулятивного декодинга.

Основным практическим применением модели стали облачные агенты Mistral Vibe, предназначенные для асинхронного написания кода. Изолированные сессии запускаются в фоновом режиме через CLI или веб-интерфейс, выполняя рутинные задачи вроде рефакторинга модулей или обновления зависимостей, что завершается автоматическим созданием pull request в GitHub. Архитектура системы позволяет переносить текущие локальные сессии в облако с сохранением истории и состояния, исключая разработчика из процесса пошагового ожидания выполнения команд.

Экосистема также интегрирована в платформу Le Chat через новый режим Work mode, который использует агентов для выполнения многосоставных задач с параллельным вызовом внешних инструментов, включая Jira, Sentry и Slack. Модель распространяется с открытыми весами под модифицированной лицензией MIT, тогда как стоимость доступа через API составляет $1.5 за миллион токенов ввода и $7.5 за вывод, что делает самостоятельный хостинг наиболее целесообразным сценарием использования.

Mistral представила модель Medium 3.5 на 128B параметров и облачных агентов для асинхронного написания кода

Ещё публикации

Mistral представила модель Medium 3.5 на 128B параметров и облачных агентов для асинхронного написания кода

Ещё публикации