Tencent полностью выложил код и веса генератора миров HY-World 2.0, который меняет подход к симуляции сцен. Если Genie 3 и Cosmos собирают обычные пиксельные видео, которые исчезают после просмотра, разработка Tencent выдает персистентные 3D-ассеты. Модель напрямую генерирует редактируемые меши и облака точек в формате 3D Gaussian Splatting, готовые к импорту в Blender, Unity или Unreal Engine.
Внутри работает сложный пайплайн: HY-Pano 2.0 собирает базовую панораму по текстовому промпту или картинке, WorldNav просчитывает траекторию, а модули расширения и реконструкции собирают из этого плотную геометрию. Это делает результат пространственно консистентным — без мерцаний и артефактов при смене угла обзора, которыми постоянно страдают видеогенераторы. По факту мы получили мощный опенсорсный аналог закрытого Marble.
Ключевое отличие этой архитектуры в том, что инференс нейросети происходит только один раз на этапе создания ассета. Дальше готовая сцена рендерится в реальном времени силами обычной видеокарты, позволяя свободно перемещаться по локации от первого или третьего лица с честным просчетом коллизий. Пощупать генерацию без локальной установки можно в официальной песочнице, но для входа придется разобраться с китайской системой авторизации.
Поделиться:
Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab →
Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm →