Все говорят, что отсутствие официальных API у генераторов музыки тормозит весь рынок нейросетевого аудио. Так ли это? Пока корпоративные пользователи Suno ждут легального интерфейса, а ElevenLabs только обещает добавить его для своей модели Music V2, сторонние разработчики уже вовсю продают готовые обходные пути. Проект Kie AI предоставляет программный доступ к созданию треков, фактически работая как серый шлюз к популярным моделям.
Под капотом заявлена поддержка версий V5.5, генерация текстов с таймкодами и создание персональных каверов. Сервис позволяет делать inpainting — переписывать неудачные куски внутри готового трека, а также разделять вокал и инструменты с последующим экспортом в MIDI. Правда, ElevenLabs в свежем обновлении предлагает похожие возможности по точечному редактированию прямо из коробки. Вопрос в том, насколько стабильно работают подобные неофициальные обертки под реальной нагрузкой.
С технической стороны написать парсер или прокси для чужой нейросети не составляет особого труда. Гораздо сложнее гарантировать клиентам доступность такого сервиса завтрашним утром. Использовать подобные инструменты для быстрого тестирования гипотез вполне разумно. Но строить коммерческий продукт на базе API, который владельцы оригинальной модели могут заблокировать в любой момент, — риск, который вряд ли оправдается.
Поделиться:
Возвращение веб-мастеров: почему ИИ заставляет нас работать больше и убивает радость от дизайна →
Плагин security-guidance от Anthropic: многоуровневая проверка кода Claude на уязвимости →