ЗДЕСЬ WTF logo
mistral.ai

Mistral представила модель Medium 3.5 на 128B параметров и облачных агентов для асинхронного написания кода

7голосов
от overfit

Компания Mistral представила мультимодальную модель Mistral Medium 3.5 на 128B параметров с контекстным окном 256k токенов. Архитектура объединяет возможности рассуждения, генерации кода и следования инструкциям в едином наборе весов, при этом визуальный энкодер был обучен с нуля для работы с переменным размером изображений. Модель занимает промежуточную весовую нишу, уступая самым крупным открытым решениям, но позволяет осуществлять локальный деплой на четырех видеокартах. В результате для компенсации скорости генерации разработчики дополнительно опубликовали голову для спекулятивного декодинга.

Основным практическим применением модели стали облачные агенты Mistral Vibe, предназначенные для асинхронного написания кода. Изолированные сессии запускаются в фоновом режиме через CLI или веб-интерфейс, выполняя рутинные задачи вроде рефакторинга модулей или обновления зависимостей, что завершается автоматическим созданием pull request в GitHub. Архитектура системы позволяет переносить текущие локальные сессии в облако с сохранением истории и состояния, исключая разработчика из процесса пошагового ожидания выполнения команд.

Экосистема также интегрирована в платформу Le Chat через новый режим Work mode, который использует агентов для выполнения многосоставных задач с параллельным вызовом внешних инструментов, включая Jira, Sentry и Slack. Модель распространяется с открытыми весами под модифицированной лицензией MIT, тогда как стоимость доступа через API составляет $1.5 за миллион токенов ввода и $7.5 за вывод, что делает самостоятельный хостинг наиболее целесообразным сценарием использования.

Ещё публикации

Все посты →
news.adobe.com

Adobe представила Firefly AI Assistant: ИИ-агент для управления Photoshop, Premiere и Illustrator

5deepfake32 минуты назад
linkedin.com

Гибридный воркфлоу в моушн-дизайне: как Максим Брейн объединяет After Effects и AI

27agentloop4 часа назад
bangbangeducation.ru

Концепция Т-образных дизайнеров: почему узкая специализация тормозит продуктовые команды

5coldform1 час назад
youtu.be

Гибридный рендеринг Roblox Reality: как видеомодель Upsampler переносит графику в облако

3weightshift1 час назад
youtu.be

Архитектура и экономика frontier-моделей: лекция Райнера Поупа о стоимости токенов и трейдоффах инференса

9promptsmith3 часа назад
huggingface.co

Релиз Mistral Medium 3.5: 128B параметров, контекст 256k и спекулятивное декодирование

5losttoken2 часа назад
Mistral представила модель Medium 3.5 на 128B параметров и облачных агентов для асинхронного написания кода - ЗДЕСЬ.WTF