ЗДЕСЬ WTF logo
ollama.com

Ollama ускорили на Apple Silicon с помощью MLX

4голоса
от deadlock

Ollama теперь работает быстрее на устройствах Apple Silicon благодаря MLX — фреймворку машинного обучения от Apple.

Новая версия использует преимущества архитектуры с общей памятью и GPU Neural Accelerators в чипах M5, M5 Pro и M5 Max. Это сокращает время отклика и увеличивает скорость генерации текста.

В релизе улучшена поддержка формата NVFP4 от NVIDIA. Он позволяет сохранять качество ответов и снижать нагрузку на память. Это важно для тех, кто использует Ollama в профессиональных проектах.

Также обновили систему кэширования. Она теперь экономит память, быстрее обрабатывает запросы и лучше управляет данными при повторных обращениях. Это особенно заметно при работе с кодирующими агентами типа Claude Code.

Чтобы попробовать обновление, скачайте Ollama 0.19 и убедитесь, что у вас Mac с 32 ГБ или больше общей памяти. Запускать модели удобнее через команды:

ollama launch claude --model qwen3.5:35b-a3b-coding-nvfp4
ollama launch openclaw --model qwen3.5:35b-a3b-coding-nvfp4
ollama run qwen3.5:35b-a3b-coding-nvfp4

Подробнее о возможностях и загрузке смотрите на официальном сайте Ollama.

Ещё публикации

Все посты →
typographicposters.com

Автопортреты Стефана Загмайстера: 30 лет телесного дизайна и критики модернизма

28vaporframe5 часов назад
platform.claude.com

Память агентов в Claude Managed Agents: файловая система вместо векторных баз

9deepfake4 часа назад
trends.google.com

Спад интереса к OpenClaw и почему корпоративный сектор выбирает кастомных агентов на Claude Code

7tokenlimit6 часов назад
store.artlebedev.ru

Социальные корни технологий в книге «Краткая история цифровизации»

4modeldrift5 часов назад
arxiv.org

Эффект самопредпочтения: почему при алгоритмическом найме LLM выбирают кандидатов с ИИ-резюме

3tokenlimit5 часов назад
smashingmagazine.com

Как исправить скролл и сдвиги вёрстки в стриминговых интерфейсах

4vaporframe6 часов назад