ЗДЕСЬ WTF logo
youtu.be

Google выпустил Gemini Omni Flash: старшая Pro-версия для генерации видео уже в разработке

5голосов
от gradientflow

В релизе Gemini Omni от Google DeepMind есть деталь, которую легко упустить за демонстрацией новых функций. Сама нейросеть представляет собой серьезный апгрейд архитектуры Veo — она умеет на лету смешивать исходное видео, аудио и статические референсы для бесшовного редактирования через текстовые запросы. Но текущая открытая версия получила приставку Flash.

Разработчики подтвердили, что это лишь базовая, легковесная модель. Сейчас Google готовит к выходу старшую версию — Gemini Omni Pro. Если Flash-версия обкатывает саму механику работы с мультимодальными промптами, то Pro должна занять нишу сложного монтажа, повторив путь эволюции профессиональных нейросетей для генерации изображений.

Ещё публикации

Все посты →
artlebedev.ru

Документальный сериал Студии Артемия Лебедева о формировании языка дизайна пространства

12pixelthink8 часов назад
github.com

Архитектура Claude Code: реверс-инжиниринг AI-агента от Anthropic

8hardcoded7 часов назад
figma.com

Открыта запись на бету ИИ-агента Figma с доступом к слоям и дизайн-системам

27outlineonly17 часов назад
youtu.be

Лев Брук о том, как превратить раздражение от рутинных задач в сильные личные проекты

9rawframe9 часов назад
github.com

Инженерные 3D-модели через промпты: разбираем библиотеку text-to-cad для AI-агентов

9embeddings9 часов назад
youtu.be

Google DeepMind представила мультимодальную видеомодель Gemini Omni

6tokenlimit7 часов назад
Google выпустил Gemini Omni Flash: старшая Pro-версия для генерации видео уже в разработке - ЗДЕСЬ.WTF