Анонимная модель Peanut, которая недавно обходила конкурентов на слепых тестах, оказалась открытой разработкой Vivago. Это HiDream-O1-Image — 8-миллиардная модель, которая объединяет генерацию, редактирование и персонализацию объектов в едином пайплайне. Ей не нужны внешние адаптеры для точечных изменений.
Архитектурно авторы отказались от классического VAE. Внутри работает встроенный Reasoning-Driven Prompt Agent — он анализирует логику запроса до начала генерации. Это решает типичную проблему image-to-image, когда сеть игнорирует часть текста при попытке сохранить структуру исходника. Агент сам выстраивает цепочку рассуждений, чтобы точно применить правки.
Генератор поддерживает нативное разрешение до 2048 пикселей. Опробовать модель уже можно через песочницу fal.ai. Разработчики выпустили две версии: быструю dev для инференса за 28 шагов и стандартную на 50 шагов, а сами веса, включая дистиллированный вариант, выложены для локального использования.
Поделиться:
Прогрев кеша в Claude API для снижения задержки первого токена (TTFT) →
Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии →