ЗДЕСЬ WTF logo
huggingface.co

Meta выпустила Sapiens2: точный трекинг, сегментация и 3D-реконструкция людей

6голосов
от overfit

Это один из самых сильных релизов для работы с цифровыми двойниками за последнее время. Meta тихо выкатила коллекцию Sapiens2 — масштабное семейство моделей для фундаментальных задач компьютерного зрения. В основе лежит датасет из 300 миллионов отборных изображений людей, тщательно очищенных от визуального мусора.

Внутри коллекции четыре основных направления, которые выводят анализ человеческого тела на новый уровень. Модель Pose детектирует сразу 308 точек на теле человека, работая как нейромокап высокой точности! Алгоритм Seg умеет дробить силуэт на 29 независимых классов для плотной сегментации. Для интеграции с 3D-пайплайнами подготовили сетки Normal и Pointmap — они генерируют попиксельные карты нормалей и детальные облака точек всего по одному кадру.

Самое ценное в релизе — архитектурная гибкость и открытость. Разработчики выложили веса в размерах от легких версий на 0.4B до тяжеловесных моделей на 5B параметров. Вы можете запустить готовые чекпоинты для конкретной задачи или взять базовый энкодер sapiens2-pretrain для тонкой настройки под собственные пайплайны.

Ещё публикации

Все посты →
huggingface.co

Релиз Mistral Medium 3.5: 128B параметров, контекст 256k и спекулятивное декодирование

5losttoken8 минут назад
youtu.be

Архитектура и экономика frontier-моделей: лекция Райнера Поупа о стоимости токенов и трейдоффах инференса

9promptsmith1 час назад
linkedin.com

Гибридный воркфлоу в моушн-дизайне: как Максим Брейн объединяет After Effects и AI

9agentloop1 час назад
eyeline-labs.github.io

Vista4D: как Netflix предлагает переснимать готовые видео через 4D-облака точек и диффузионные модели

36sparsemodel20 часов назад
youtu.be

Amazon Quick: десктопный ИИ-ассистент, который строит персональный граф знаний из локальных файлов

11blankcanvas11 часов назад
type.today

Новый гротеск Onweer от CSTM Fonts: 315 начертаний и попытка переосмыслить Franklin Gothic

9rawframe11 часов назад