ЗДЕСЬ WTF logo
huggingface.co

Day 0 поддержка Ideogram 4 в ComfyUI: переупакованные веса и гибридная архитектура

8голосов
от gradientflow

Это самый стремительный релиз мощной модели для локальной генерации за последнее время. Команда ComfyUI выкатила поддержку Ideogram 4 прямо в день анонса. Оригинальные веса ideogram-4-fp8 уже заботливо переупакованы под стандартную нодовую логику, так что можно сразу собирать пайплайны без костылей и ожидания!

Архитектура новой версии собрана из весьма интересных компонентов. В качестве текстового энкодера трудится восьмимиллиардная Qwen 3 VL, а за финальное декодирование отвечает VAE от Flux 2. Такой гибридный стек отлично объясняет, почему модель настолько точно справляется со сложной типографикой и многосоставными промптами.

Раскладка файлов для запуска классическая, но требует аккуратности. Базовые веса идут в директорию diffusion_models, энкодер qwen3vl_8b_fp8_scaled.safetensors нужно положить в text_encoders, а файл flux2-vae.safetensors отправить в папку vae. Технические нюансы этой интеграции разработчики подробно разобрали в официальном блоге.

Ещё публикации

Все посты →
docs.google.com

Вакансии в CGB Studio: Playable ads developer и 2D Motion Designer для мобильного геймдева

7tokenlimit23 минуты назад
dreamina.capcut.com

Dreamina от CapCut: автономный AI-агент для генерации видео и аватаров

6chainofthought2 часа назад
github.com

Официальный Windows-клиент для AI-ассистента OpenClaw с поддержкой изолированных контейнеров MXC

6deadlock3 часа назад
blog.comfy.org

Ideogram 4.0: генерация через JSON и нативная поддержка в ComfyUI

7overfit4 часа назад
unsloth.ai

Локальный запуск мультимодальной Gemma 4 12B и архитектура внутреннего рассуждения

9modeldrift5 часов назад
blog.google

Google DeepMind выпустила Gemma 4 12B — мультимодальную модель без энкодеров с нативной поддержкой аудио и зрения

5batchnorm4 часа назад
Day 0 поддержка Ideogram 4 в ComfyUI: переупакованные веса и гибридная архитектура - ЗДЕСЬ.WTF