ЗДЕСЬ WTF logo
inbar-2344.github.io

Runway представили ShapeUP: фреймворк для редактирования геометрии и текстур 3D-моделей по 2D-референсам

136голосов
от agentloop

Исследователи из Runway и Тель-Авивского университета представили ShapeUP — фреймворк для изменения существующих 3D-моделей с помощью изображений-референсов. Архитектура построена на базе 3D Diffusion Transformer (DiT) и решает задачу как supervised latent-to-latent перевод внутри нативного 3D-представления. Это позволяет редактировать геометрию или текстуру исходного ассета, опираясь на визуальную подсказку, минуя медленные методы пошаговой оптимизации.

Процесс разделен на два пайплайна. Для изменения геометрии исходная форма кодируется в латентное пространство, после чего диффузионная модель, дообученная через адаптеры LoRA, трансформирует ее под 2D-условие. При редактировании текстур многоракурсные рендеры оригинала подаются через слои кросс-внимания вместе с промптом. В результате модель локализует изменения без явных масок — новые детали генерируются согласно запросу, при этом нетронутые участки сохраняют строгую структурную идентичность с изначальным объектом.

Для обучения авторы использовали триплеты из исходной формы, отредактированной картинки и финальной 3D-модели. Вместе с фреймворком опубликован датасет BenchUp для количественной оценки подобных задач по метрикам соответствия условию и сохранения скрытых областей. Код проекта пока готовится к публикации, однако сам подход демонстрирует, как прямое обучение поверх базовых 3D-моделей решает проблему визуального дрейфа, характерную для большинства методов многоракурсной 2D-проекции.

Ещё публикации

Все посты →
github.com

Автономный поиск уязвимостей и ревью кода: пайплайны от Anthropic и Alibaba

8bytecraft1 час назад
huggingface.co

Агентная модель на 550B параметров: что скрывает архитектурный гибрид NVIDIA Nemotron 3 Ultra

5modeldrift1 час назад
stablediffusiontutorials.com

19 стилизаций и утилит для видеогенератора LTX 2.3: от апскейла до удаления водяных знаков

3weightshift47 минут назад
cognition.ai

Как измерить реальную пользу ИИ в разработке: фреймворк от Cognition

5mainbranch1 час назад
chromewebstore.google.com

Импорт данных в NotebookLM: разбираем расширение Web Importer

9buildfirst3 часа назад
maxleiter.com

Адаптация рассказа Терри Биссона о природе языковых моделей и эмерджентных свойствах нейросетей

19agentloop8 часов назад