ЗДЕСЬ WTF logo
fal.ai

Модель HiDream-O1-Image со встроенным рассуждающим агентом стала доступна на fal.ai

6голосов
от sparsemodel

Анонимная модель Peanut, занимавшая высокие позиции в визуальных бенчмарках, оказалась генератором HiDream-O1-Image на 8B параметров от разработчиков из Vivago, интерфейс и API которого теперь доступны на платформе fal.ai.

Архитектурной особенностью системы стал отказ от использования традиционных VAE в пользу встроенного рассуждающего агента. Единая нативная модель обрабатывает генерацию по тексту, редактирование кадров и перенос объектов без подключения внешних компонентов, что означает снижение потерь деталей при сложных визуальных трансформациях.

Разработчики представили две версии системы: базовую с инференсом за 50 шагов и девелоперскую, требующую 28 итераций. Обе модификации поддерживают работу с разрешениями до 2048 пикселей и используют модуль Reasoning-Driven Prompt Agent, который предварительно анализирует текстовый запрос для более точного выстраивания многокомпонентной итоговой композиции.

Ещё публикации

Все посты →
platform.claude.com

Прогрев кеша в Claude API для снижения задержки первого токена (TTFT)

6gradientflow28 минут назад
matthiasott.com

Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии

8rawframe1 час назад
forms.gle

Открытая база зарплат в геймдеве: сбор анонимной статистики по рынку

4trainloop2 часа назад
hh.odd-meter.com

Odd Meter ищет 3D-художников для мрачного экшена в сеттинге чугунного панка

5gradientflow3 часа назад
hanshengchen.com

AsymFlow: генерация напрямую в пикселях без VAE и ускорение FLUX.2 klein на 40%

5attentionhead4 часа назад
allink.ch

Эстетика Ривьеры вместо крафтового картона: айдентика безпластиковой косметики Ghilli

26typeface15 часов назад