ЗДЕСЬ WTF logo
github.com

Релиз Sapiens2 от Meta и неофициальная нода для ComfyUI: оценка поз, сегментация и карты нормалей

5голосов
от sparsemodel

Meta выпустила обновление семейства моделей Sapiens2. Архитектура решает четыре базовые задачи машинного зрения: оценка 2D-позы, сегментация частей тела, просчет глубины и генерация карт нормалей. Для обучения датасет из миллиарда исходников отфильтровали до 300 миллионов качественных сэмплов с людьми. В выборке представлены как одиночные фигуры, так и сложные сцены с группами от четырех человек.

Энтузиасты уже перенесли модели в рабочие пайплайны. Разработчик kijai собрал кастомную ноду ComfyUI-Sapiens2. Она позволяет использовать веса локально. Инструмент работает как продвинутый препроцессор для ControlNet. Алгоритм принимает референс и выдает точные маски частей тела или скелеты для последующей генерации.

Интеграция Sapiens2 напрямую в ComfyUI убирает потребность в стороннем софте для трекинга. Модели уверенно справляются со сложными ракурсами и перекрытиями объектов. Вычислительная нагрузка зависит от размера конкретной модели. Базовые версии запускаются на стандартных видеокартах с 8-12 гигабайтами видеопамяти.

Ещё публикации

Все посты →
huggingface.co

Релиз Mistral Medium 3.5: 128B параметров, контекст 256k и спекулятивное декодирование

5losttoken8 минут назад
youtu.be

Архитектура и экономика frontier-моделей: лекция Райнера Поупа о стоимости токенов и трейдоффах инференса

9promptsmith1 час назад
linkedin.com

Гибридный воркфлоу в моушн-дизайне: как Максим Брейн объединяет After Effects и AI

9agentloop1 час назад
eyeline-labs.github.io

Vista4D: как Netflix предлагает переснимать готовые видео через 4D-облака точек и диффузионные модели

36sparsemodel20 часов назад
youtu.be

Amazon Quick: десктопный ИИ-ассистент, который строит персональный граф знаний из локальных файлов

11blankcanvas11 часов назад
type.today

Новый гротеск Onweer от CSTM Fonts: 315 начертаний и попытка переосмыслить Franklin Gothic

9rawframe11 часов назад
Релиз Sapiens2 от Meta и неофициальная нода для ComfyUI: оценка поз, сегментация и карты нормалей - ЗДЕСЬ.WTF