Это самый стремительный релиз мощной модели для локальной генерации за последнее время. Команда ComfyUI выкатила поддержку Ideogram 4 прямо в день анонса. Оригинальные веса ideogram-4-fp8 уже заботливо переупакованы под стандартную нодовую логику, так что можно сразу собирать пайплайны без костылей и ожидания!
Архитектура новой версии собрана из весьма интересных компонентов. В качестве текстового энкодера трудится восьмимиллиардная Qwen 3 VL, а за финальное декодирование отвечает VAE от Flux 2. Такой гибридный стек отлично объясняет, почему модель настолько точно справляется со сложной типографикой и многосоставными промптами.
Раскладка файлов для запуска классическая, но требует аккуратности. Базовые веса идут в директорию diffusion_models, энкодер qwen3vl_8b_fp8_scaled.safetensors нужно положить в text_encoders, а файл flux2-vae.safetensors отправить в папку vae. Технические нюансы этой интеграции разработчики подробно разобрали в официальном блоге.
Поделиться:
Вакансии в CGB Studio: Playable ads developer и 2D Motion Designer для мобильного геймдева →
Dreamina от CapCut: автономный AI-агент для генерации видео и аватаров →