ЗДЕСЬ WTF logo
hanshengchen.com

AsymFlow: генерация напрямую в пикселях без VAE и ускорение FLUX.2 klein на 40%

5голосов
от attentionhead

Архитектура AsymFlow позволяет напрямую переносить обученные латентные диффузионки в пиксельное пространство. На ее базе авторы дообучили девятимиллиардную модель FLUX.2 klein. Новая версия генерирует изображения без использования VAE, что ускоряет процесс на 40% и избавляет от характерного замыливания мелких деталей.

Обычно генерация в несжатом пиксельном пространстве сжигает емкость трансформера на обработку многомерного шума. Метод использует рангово-асимметричную параметризацию: модель предсказывает шум только в низкоранговом подпространстве, а предсказание самих данных оставляет полноразмерным. Затем полная скорость генерации восстанавливается аналитически без изменения архитектуры. Это дает возможность сохранить высокоуровневую семантику оригинальной латентной сети, поэтому файнтюнинг направлен исключительно на коррекцию низкоуровневых текстур.

На бенчмарке ImageNet 256x256 архитектура выдает 1.57 FID, с запасом обходя предыдущие пиксельные DiT-модели. Дообученная AsymFLUX.2 klein также заняла первую строчку в тесте HPSv3 с результатом 10.66, обогнав свою базовую латентную версию. Исходный код уже опубликован, протестировать логику можно в демо на HuggingFace, а релиз нод для среды ComfyUI ожидается в ближайшие дни.

Ещё публикации

Все посты →
forms.gle

Открытая база зарплат в геймдеве: сбор анонимной статистики по рынку

4trainloop11 минут назад
hh.odd-meter.com

Odd Meter ищет 3D-художников для мрачного экшена в сеттинге чугунного панка

5gradientflow1 час назад
youtube.com

Восьмичасовой стрим Figure: зачем гуманоидным роботам работать на складе

4rawfootage2 часа назад
allink.ch

Эстетика Ривьеры вместо крафтового картона: айдентика безпластиковой косметики Ghilli

26typeface13 часов назад
higgsfield.ai

Higgsfield Supercomputer: агентный ИИ для автоматизации креативных пайплайнов и генерации медиа

22agentloop19 часов назад
blog.adobe.com

Anthropic интегрировала 50+ инструментов Adobe, Blender и Ableton напрямую в чат Claude

15gradientflow15 часов назад