Компания xAI выпустила превью-версию модели генерации видео Grok Imagine Video 1.5, которая стала доступна для использования через API на платформе fal. Модель поддерживает преобразование статических изображений в видеоряд продолжительностью до пятнадцати секунд, включая возможность одновременного синтеза аудиодорожки.
Первые результаты тестирования показывают специфическое распределение возможностей нейросети при работе с различными типами сцен. Алгоритм демонстрирует высокую точность при проработке мимики, передаче эмоций и синхронизации диалогов, что делает его эффективным для портретных планов, при этом в сценах со сложной динамикой и масштабным движением объектов генерация пока уступает конкурирующим китайским нейросетям.
Работа с моделью тарифицируется посекундно в зависимости от выбранного разрешения кадров. Генерация одной секунды в формате 480p оценивается в $0.08, в то время как рендер в разрешении 720p стоит $0.14, в результате чего стандартный пятнадцатисекундный ролик в максимальном качестве обходится в $2.10. Обработка каждого входного изображения добавляет к базовой стоимости один цент, что означает полное включение затрат на синтез звука в основной тариф.
Поделиться:
SANA-Streaming от NVIDIA: редактирование видеопотока на лету при 24 FPS на одной RTX 5090 →
Figma встроила ИИ-агента прямо в холст: конец рутине или генератор посредственности →