ЗДЕСЬ WTF logo
civitai.com

Экспериментальные LoRA-модели ACEStep для архитектуры ACE Audio

5голосов
от losttoken

В открытом доступе появились экспериментальные LoRA-модели ACEStep для нейросетевой архитектуры ACE Audio. Они натренированы на синтетических данных. Модели локально меняют стиль базовой генерации звука.

Набор включает пять жанровых направлений: PHONK, DEEPHOUSE, AMBIENT, FUNK и DEATHSTEP. Веса распространяются в формате SafeTensor. Размер одного чекпоинта составляет около 84 МБ. Для корректного инференса требуется конфигурационный файл .metadata.json. Он должен находиться в одной директории с моделью.

Разработчик предлагает применять эти веса для создания лайв-ремиксов в аудиосреде DEMON. Управление стилем работает через текстовые триггеры из метаданных. Сейчас в репозитории наблюдаются ошибки с доступом к части конфигурационных файлов, но базовая модель для фонка скачивается и работает стабильно.

Ещё публикации

Все посты →
habr.com

Разбор концепции AI-Disrupt PDLC: почему код становится вторичным артефактом, а спецификация — первичным

5losttoken14 минут назад
higgsfield.ai

AI-плагин Higgsfield для Premiere Pro и After Effects: генерация, инпеинтинг и апскейл без рендера

8chainofthought54 минуты назад
daydreamlive.github.io

DEMON: потоковый движок, превращающий нейросети в живой музыкальный инструмент

15sparsemodel2 часа назад
blog.chaos.com

Chaos выпустила ИИ-рендер Veras для архитектурной визуализации с поддержкой V-Ray и Enscape

9sparsemodel1 час назад
blog.chaos.com

Интеграция нейросети Veras в V-Ray для генерации архитектурных концепций и анимации

6losttoken1 час назад
forms.gle

Вакансия GenAI-специалиста: генерация видео через WAN в ComfyUI

3overfit1 час назад
Экспериментальные LoRA-модели ACEStep для архитектуры ACE Audio - ЗДЕСЬ.WTF