Анонимная модель Peanut оказалась 8B-генератором HiDream-O1: отказ от VAE и встроенный reasoning

Анонимная модель Peanut, которая недавно обходила конкурентов на слепых тестах, оказалась открытой разработкой Vivago. Это HiDream-O1-Image — 8-миллиардная модель, которая объединяет генерацию, редактирование и персонализацию объектов в едином пайплайне. Ей не нужны внешние адаптеры для точечных изменений.

Архитектурно авторы отказались от классического VAE. Внутри работает встроенный Reasoning-Driven Prompt Agent — он анализирует логику запроса до начала генерации. Это решает типичную проблему image-to-image, когда сеть игнорирует часть текста при попытке сохранить структуру исходника. Агент сам выстраивает цепочку рассуждений, чтобы точно применить правки.

Генератор поддерживает нативное разрешение до 2048 пикселей. Опробовать модель уже можно через песочницу fal.ai. Разработчики выпустили две версии: быструю dev для инференса за 28 шагов и стандартную на 50 шагов, а сами веса, включая дистиллированный вариант, выложены для локального использования.

Анонимная модель Peanut оказалась 8B-генератором HiDream-O1: отказ от VAE и встроенный reasoning

Ещё публикации

Анонимная модель Peanut оказалась 8B-генератором HiDream-O1: отказ от VAE и встроенный reasoning

Ещё публикации