ЗДЕСЬ WTF logo
huggingface.co

Набор LoRA для LTX 2.3: инпеинтинг, стилизация и замена объектов в видео

9голосов
от tokenlimit

Свежий набор LoRA-моделей для LTX 2.3 от Alissonerdx — это мощнейший апгрейд для локальной работы с видео. Особенно впечатляет экспериментальная модель Edit Anything. Она натренирована на 8000 пар видео и умеет добавлять, удалять объекты, заменять фон или полностью менять стилистику исходника. Модель отлично справляется с генерацией синтетических датасетов и поддерживает десятки стилей, от карандашного наброска до пластилиновой анимации.

Помимо стилизации, в репозитории лежат веса для точечного инпеинтинга, включая версию с поддержкой визуальных референсов. Здесь кроется важный технический нюанс. Чтобы результаты совпадали с условиями обучения, маску нельзя передавать отдельным каналом — её нужно вшивать прямо в направляющее видео с помощью LTXVAddGuideMulti. При этом сама маска должна быть цвета мадженты (255, 0, 255), а зелёный фон референса — чистым хромакеем (0, 255, 0). Также автор рекомендует пропускать маску через Blockify Mask с размером 8x8, чтобы отвязать генерацию от формы старого объекта.

Логика промптинга жестко структурирована и требует пространственной конкретики. Модель лучше всего реагирует на прямые глаголы-команды вроде Add, Remove или Convert the video into a Watercolor Painting style. Для быстрого старта в ComfyUI уже собран готовый воркфлоу, который правильно маршрутизирует все эти цвета и маски. Инструменты сложной видеоредактуры наконец-то можно адекватно крутить локально!

Ещё публикации

Все посты →
ruixu.me

Автоматическая ретопология в SATO: действительно ли AI научился выдавать художественную 3D-сетку

23batchnorm1 час назад
dsgners.ru

Как Т-Банк перестроил систему грейдов для 600 дизайнеров: матрица уровней и компетенций

5glitchmood16 минут назад
mikeindustries.com

Трансформация роли продуктового дизайнера: от ручной сборки интерфейсов к управлению ИИ-агентами

27drawmore5 часов назад
ruixu.me

Генерация 3D-сеток с нативной UV-сегментацией в архитектуре SATO

7weightshift1 час назад
shir-man.com

Динамический рейтинг бесплатных LLM для агентов: спасение для прототипов или API-рулетка

5latentspace1 час назад
behance.net

Концепт AI for iOS: почему красивые виджеты не решают проблем UX

5trainloop2 часа назад