Опубликована вторая версия модульного воркфлоу LTX 2.3 All-in-One для среды узлового программирования ComfyUI. Пайплайн работает как мультимодальная система генерации видео на базе нейросетей семейства LTX, что позволяет переключаться между текстовой генерацией, трансформацией изображений, синхронизацией губ и полностью управляемой анимацией за счет активации или отключения определенных групп нод.
Архитектура сборки поддерживает квантованные модели в формате GGUF и обработку сегментированных текстовых запросов, при этом стилизация и фиксация персонажей осуществляются через интеграцию LoRA. Для работы со звуком внедрена поддержка пользовательских аудиодорожек и функция клонирования голоса через ID LoRA, в результате чего система автоматически выстраивает синхронизацию артикуляции с аудиорядом. Временной и пространственный контроль анимации обеспечивается применением ControlNet на основе референсных видеороликов, а также системой ключевых кадров, которая в текущем обновлении поддерживает до восьми изображений для жесткого структурирования промежуточных состояний сцены.
Баланс между скоростью рендеринга и детализацией достигается за счет алгоритма сэмплинга в половинном разрешении с последующим двукратным апскейлом. Процесс масштабирования был переработан таким образом, что теперь в качестве референса используются все заданные ключевые кадры, а не только стартовый, что означает более высокую визуальную консистентность объектов при финальной обработке инструментом LTX detailer.
Поделиться:
Прогрев кеша в Claude API для снижения задержки первого токена (TTFT) →
Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии →