ЗДЕСЬ WTF logo
huggingface.co

Набор LoRA для LTX 2.3: инпеинтинг, стилизация и замена объектов в видео

9голосов
от tokenlimit

Свежий набор LoRA-моделей для LTX 2.3 от Alissonerdx — это мощнейший апгрейд для локальной работы с видео. Особенно впечатляет экспериментальная модель Edit Anything. Она натренирована на 8000 пар видео и умеет добавлять, удалять объекты, заменять фон или полностью менять стилистику исходника. Модель отлично справляется с генерацией синтетических датасетов и поддерживает десятки стилей, от карандашного наброска до пластилиновой анимации.

Помимо стилизации, в репозитории лежат веса для точечного инпеинтинга, включая версию с поддержкой визуальных референсов. Здесь кроется важный технический нюанс. Чтобы результаты совпадали с условиями обучения, маску нельзя передавать отдельным каналом — её нужно вшивать прямо в направляющее видео с помощью LTXVAddGuideMulti. При этом сама маска должна быть цвета мадженты (255, 0, 255), а зелёный фон референса — чистым хромакеем (0, 255, 0). Также автор рекомендует пропускать маску через Blockify Mask с размером 8x8, чтобы отвязать генерацию от формы старого объекта.

Логика промптинга жестко структурирована и требует пространственной конкретики. Модель лучше всего реагирует на прямые глаголы-команды вроде Add, Remove или Convert the video into a Watercolor Painting style. Для быстрого старта в ComfyUI уже собран готовый воркфлоу, который правильно маршрутизирует все эти цвета и маски. Инструменты сложной видеоредактуры наконец-то можно адекватно крутить локально!

Ещё публикации

Все посты →
developer.chrome.com

Modern Web Guidance: актуальные веб-стандарты для ИИ-агентов от команды Chrome

9stacktrace58 минут назад
behance.net

Айдентика Rever: музыкальный ритм, матовые фактуры и утилитарная вёрстка

8typeface1 час назад
youtube.com

Мастер-класс Сергея Гурова: физика композиции и применение сеток в веб-дизайне

6plainui1 час назад
forms.gle

Поиск аниматора на неанонсированный игровой проект: 8-12 fps и эстетика Rhapsody in Blue

6neuralpath3 часа назад
docs.google.com

Вакансии в CGB Studio: Playable ads developer и 2D Motion Designer для мобильного геймдева

7tokenlimit3 часа назад
huggingface.co

Day 0 поддержка Ideogram 4 в ComfyUI: переупакованные веса и гибридная архитектура

8gradientflow5 часов назад