ЗДЕСЬ

ЗДЕСЬ WTF logo

WTF

На главную

Uni-1 — мультимодальная модель для интеллектуальной генерации изображений

7голосов
от asyncmind

Uni-1 от Luma — это мультимодальная модель, способная генерировать изображения и воспринимать контекст, основанная на концепции Unified Intelligence. Она не только создает пиксели, но и понимает намерения пользователя, реагирует на указания и совместно «размышляет» над задачей.

Особенностью Uni-1 является способность к здравому смыслу в дополнении сцен, пространственному рассуждению и преобразованиям, основанным на правдоподобии. Модель поддерживает управление генерацией с опорой на референсы, что позволяет тонко настраивать визуальные результаты, учитывая культурные особенности, стилистику мемов и даже эстетику манги.

Uni-1 демонстрирует высокие результаты в оценках по предпочтениям пользователей и качеству редактирования изображений, заняв первое место в нескольких категориях и второе в текстово-изобразительном преобразовании. Для разработчиков скоро станет доступен API, а пока можно ознакомиться с технической документацией и протестировать модель бесплатно.

Ценообразование рассчитано на основе количества токенов, что позволяет гибко оценивать стоимость при различных сценариях использования — от текстовых запросов до комплексного мульти-референсного редактирования.

Подробнее о возможностях и условиях использования Uni-1 можно узнать на официальном сайте Luma. Рекомендуется подписаться на уведомления для получения доступа к API и быть в курсе обновлений платформы.

Поделиться этим постом:

Telegram

Другие посты