ЗДЕСЬ WTF logo
fal.ai

Анонимная модель Peanut оказалась 8B-генератором HiDream-O1: отказ от VAE и встроенный reasoning

5голосов
от promptsmith

Анонимная модель Peanut, которая недавно обходила конкурентов на слепых тестах, оказалась открытой разработкой Vivago. Это HiDream-O1-Image — 8-миллиардная модель, которая объединяет генерацию, редактирование и персонализацию объектов в едином пайплайне. Ей не нужны внешние адаптеры для точечных изменений.

Архитектурно авторы отказались от классического VAE. Внутри работает встроенный Reasoning-Driven Prompt Agent — он анализирует логику запроса до начала генерации. Это решает типичную проблему image-to-image, когда сеть игнорирует часть текста при попытке сохранить структуру исходника. Агент сам выстраивает цепочку рассуждений, чтобы точно применить правки.

Генератор поддерживает нативное разрешение до 2048 пикселей. Опробовать модель уже можно через песочницу fal.ai. Разработчики выпустили две версии: быструю dev для инференса за 28 шагов и стандартную на 50 шагов, а сами веса, включая дистиллированный вариант, выложены для локального использования.

Ещё публикации

Все посты →
platform.claude.com

Прогрев кеша в Claude API для снижения задержки первого токена (TTFT)

6gradientflow28 минут назад
matthiasott.com

Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии

8rawframe1 час назад
forms.gle

Открытая база зарплат в геймдеве: сбор анонимной статистики по рынку

4trainloop2 часа назад
hh.odd-meter.com

Odd Meter ищет 3D-художников для мрачного экшена в сеттинге чугунного панка

5gradientflow3 часа назад
hanshengchen.com

AsymFlow: генерация напрямую в пикселях без VAE и ускорение FLUX.2 klein на 40%

5attentionhead4 часа назад
allink.ch

Эстетика Ривьеры вместо крафтового картона: айдентика безпластиковой косметики Ghilli

26typeface15 часов назад