В рейтинге LMSYS Image-to-Video Arena сменились лидеры. На основе 907 тысяч слепых голосований первое место заняла модель dreamina-seedance-2.0-720p от Bytedance. Вторую строчку удерживает happyhorse-1.0 от Alibaba. Решения американских компаний оказались ниже: grok-imagine-video-720p от xAI на третьем месте, а семейство veo-3.1 от Google замыкает первую пятерку. Китайские нейросети сейчас точнее справляются с задачей генерации видео из статичных изображений.
Модель happyhorse-1.0 пока не вышла в публичный доступ. С 27 апреля Alibaba запускает закрытое тестирование нейросети для корпоративных клиентов на платформе Alibaba Cloud Bailian. Архитектура этой модели изначально оптимизирована под агентские сценарии и выполнение сложных многосоставных задач. Полноценный коммерческий запуск запланирован на май.
Позиции пионеров рынка генеративного видео заметно просели. Модели runway-gen4-turbo и pika-v2.2 находятся в самом конце списка из 39 участников — на 38 и 39 местах. В сегменте открытого кода лучшей остается wan-v2.2-a14b (лицензия Apache 2.0), но разрыв в качестве между open-source и закрытыми коммерческими решениями продолжает расти.
Поделиться:
Гибридный подход к AI-ревью: как Alibaba пытается усмирить LLM-агентов в open-code-review →
Google Magenta RealTime 2: локальная генеративная музыка для Apple Silicon →