Это действительно мощное обновление для всех, кто встраивает генеративные нейросети в свои продукты. Google открыл общий доступ к Nano Banana 2 (под капотом Gemini 3.1 Flash Image) и Nano Banana Pro (Gemini 3 Pro Image). Обе модели теперь стабильно работают по API через Gemini Enterprise Agent Platform. Генерация в разрешениях 1K и 2K ушла в полноценный релиз, а 4K пока остается в стадии превью.
Но самая впечатляющая фича кроется в работе с контекстом. Nano Banana 2 научилась принимать видеофайлы в качестве входного промпта! Модель не просто выдергивает случайные кадры, а полноценно анализирует происходящее на видео, понимает действия объектов и визуальную логику. Опираясь на этот анализ, нейросеть может генерировать контекстно-зависимые арты, точные превью-обложки или сложную инфографику.
Крупные платформы уже начали переводить на эти модели свои пайплайны. Adobe встроил их в Firefly Enterprise для автоматизации создания контента, а Shopify использует для запуска виртуальных примерочных и динамического расширения карточек товаров. Фокус явно сместился с простых текстовых генераций на сложные сценарии, где требуется жесткий контроль над результатом и понимание сложных мультимодальных данных.
Поделиться:
Дизайн миланского бара Balay: отказ от эстетики listening bar в пользу филиппинского хаоса и винтажной типографики →
Динамические воркфлоу в Codex: как скрипт с GitHub заменяет оркестрацию агентов от Claude →