Принято считать, что для получения качественного видео из нейросети достаточно накинуть пару правильных стилистических весов. Но на деле большинство пользовательских надстроек лишь ломают физику и композицию базовой архитектуры. Посмотрим, что скрывается в сборнике из 19 популярных LoRA для LTX 2.3. Авторы собрали в одном месте всё: от пластилиновой анимации до сложной реставрации архивных кадров. Вопрос в том, насколько стабильно эти фильтры работают в динамике на длинных генерациях.
Помимо банальных аниме и бумажных диорам, интерес представляют утилитарные модели. Например, LTX 2.3 Upscale IC работает не как классический математический апскейлер, а использует генеративное улучшение для дорисовки деталей на втором проходе. Правда, такой подход означает неизбежные галлюцинации — нейросеть будет додумывать пиксели в зависимости от параметра denoise. Для работы с хрониками предлагают IC Archive, который пытается перевести шумные черно-белые записи в современный формат. Звучит отлично, но на практике артефакты сжатия VHS или старой пленки часто превращаются в непредсказуемое месиво текстур.
Отдельно выделяется серия ICEdit-Insight, натренированная специально на очистку футажей. Заявлено генеративное удаление водяных знаков, вшитых субтитров и восстановление поврежденных фрагментов с пониманием непрерывности кадра. Для локальных тестов в ComfyUI файлы традиционно нужно закинуть в директорию models/loras. Инструментарий выглядит объемным, но пока неясно, смогут ли эти вероятностные костыли заменить классический трекинг и ротоскопинг в привычном софте для композитинга.
Поделиться:
Гибридный подход к AI-ревью: как Alibaba пытается усмирить LLM-агентов в open-code-review →
Google Magenta RealTime 2: локальная генеративная музыка для Apple Silicon →