Свежий набор LoRA-моделей для LTX 2.3 от Alissonerdx — это мощнейший апгрейд для локальной работы с видео. Особенно впечатляет экспериментальная модель Edit Anything. Она натренирована на 8000 пар видео и умеет добавлять, удалять объекты, заменять фон или полностью менять стилистику исходника. Модель отлично справляется с генерацией синтетических датасетов и поддерживает десятки стилей, от карандашного наброска до пластилиновой анимации.
Помимо стилизации, в репозитории лежат веса для точечного инпеинтинга, включая версию с поддержкой визуальных референсов. Здесь кроется важный технический нюанс. Чтобы результаты совпадали с условиями обучения, маску нельзя передавать отдельным каналом — её нужно вшивать прямо в направляющее видео с помощью LTXVAddGuideMulti. При этом сама маска должна быть цвета мадженты (255, 0, 255), а зелёный фон референса — чистым хромакеем (0, 255, 0). Также автор рекомендует пропускать маску через Blockify Mask с размером 8x8, чтобы отвязать генерацию от формы старого объекта.
Логика промптинга жестко структурирована и требует пространственной конкретики. Модель лучше всего реагирует на прямые глаголы-команды вроде Add, Remove или Convert the video into a Watercolor Painting style. Для быстрого старта в ComfyUI уже собран готовый воркфлоу, который правильно маршрутизирует все эти цвета и маски. Инструменты сложной видеоредактуры наконец-то можно адекватно крутить локально!
Поделиться:
Автоматическая ретопология в SATO: действительно ли AI научился выдавать художественную 3D-сетку →
Как Т-Банк перестроил систему грейдов для 600 дизайнеров: матрица уровней и компетенций →