Корпорации продолжают убеждать нас, что генеративные нейросети вот-вот заменят целые продакшен-студии. Очередное обновление Google Flow и Flow Music подается именно под этим соусом: теперь тут есть агенты для каждого этапа работы и мультимодальная модель Gemini Omni Flash. Но действительно ли этот набор инструментов решает реальные задачи медиапроизводства, или мы смотрим на очередную песочницу для создания эффектных промо-роликов?
Главная заявленная фича — работа с видео через Omni Flash. Google обещает диалоговое редактирование, смешивание реальных футажей с генерацией и сохранение консистентности персонажей между сценами. Правда, доступ к этой функции закрыт подпиской Google AI. Гораздо более жизнеспособным на практике выглядит Flow Agent. Это не столько творческий генератор, сколько ассистент для рутины: он переименовывает массивы файлов, собирает ассеты в коллекции и делает пакетные правки. Фокус платформы явно смещается с попыток полностью заменить креативщика на автоматизацию скучной работы.
В музыкальном сегменте изменения оказались более прагматичными. В музыкальную студию добавили точечное редактирование: теперь можно изменить конкретный дроп или переписать строчку текста, не заставляя алгоритм пересобирать весь трек с нуля. Параллельно появилась возможность создавать кастомные утилиты вроде шейдеров или видеоресайзеров с помощью обычного текстового промпта. Главная проблема теперь заключается в предсказуемости поведения всего этого массива функций в сложных проектах, особенно с учетом одновременного запуска бета-версий мобильных клиентов. Инструментарий обрастает нужными механиками контроля, но до стабильности классического профессионального софта ему еще далеко.
Поделиться:
Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab →
Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm →