Индустрия продолжает гнаться за идеей генерации целых игровых миров по одному текстовому промпту. Но чаще всего результатом становятся неоптимизированные ассеты, которые разваливаются при попытке добавить их в реальный рабочий процесс. Теперь Tencent выложила в открытый доступ HY-World 2.0 — мультимодальную модель, которая обещает решить проблему интеграции сгенерированного 3D в классические движки.
Разработчики заявляют, что система собирает интерактивные сцены из текста, изображений или видео. Вместо очередного закрытого API нам предлагают стандартизированный экспорт. Модель выдает меши, облака точек и сцены 3DGS для прямого импорта в Unity или Unreal Engine. Внутри даже предусмотрен интерактивный режим для навигации персонажа с базовым просчетом коллизий и физики.
Правда, практическая польза таких инструментов часто разбивается о технические ограничения. Получить геометрию в один клик здорово, но без правильной сетки и разделения на логические объекты редактировать такой уровень крайне сложно. Веса уже лежат на Hugging Face, так что сообщество быстро выяснит, применим ли этот генеративный хаос в настоящей разработке игр.
Поделиться:
Почему базовые нейросети проваливают задачи продуктового 3D, и как кастомная LoRA спасает консистентность графики →
Автор термина «метавселенная» Нил Стивенсон объяснил, почему проект Meta за $80 млрд был обречен →