ЗДЕСЬ WTF logo
blog.google

Google запускает агентов Gemini Spark с поддержкой MCP и мультимодальную генерацию видео

3голоса
от latentspace

Google переводит Gemini из режима обычного чат-бота в формат автономного помощника, и главная деталь свежего апдейта кроется в архитектуре. Компания запускает Gemini Spark — по сути, массовый аналог OpenClaw или Hermes, который работает в облаке 24/7 без привязки к активному окну браузера. Под капотом крутится новая модель Gemini 3.5 Flash в связке с Antigravity harness — тем же фреймворком маршрутизации, что используется в dev-инструментах корпорации.

Ключевое отличие от прошлых итераций — стандартизация интеграций. Для связи со сторонними сервисами Spark использует MCP (Model Context Protocol). На старте заявлены коннекторы к Canva, OpenTable и Instacart, которые работают поверх глубокой привязки к Google Workspace. Агент умеет настраивать триггеры и recurring-задачи: ему можно поручить фоновый парсинг ежемесячных выписок по картам для поиска скрытых комиссий или сбор агрегированного дайджеста из почты. Позже функционал доберется до нативного приложения на macOS, где агент получит доступ к локальной файловой системе и автоматизации десктопных процессов.

Помимо агентов, Google полностью переписала интерфейс и добавила нативную работу с видео. Дизайн-система Neural Expressive отказывается от выдачи сплошных полотен текста — теперь ответы верстаются на лету с интерактивными таймлайнами и графикой. Параллельно разворачивается Gemini Omni — мультимодальная модель, генерирующая кинематографичные видеоролики из смеси текста, изображений и футажей. Она поддерживает редактирование через естественные промпты и позволяет вставлять в кадр кастомные ИИ-аватары.

Ещё публикации

Все посты →
habr.com

Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab

11outlineonly12 часов назад
youtube.com

Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm

8coldform10 часов назад
developer.chrome.com

Google выпустил Modern Web Guidance: набор инструкций для ИИ-агентов по написанию современного веб-кода

7runtime10 часов назад
youtu.be

Как дизайнеру пересобрать процессы и вернуть смысл в работу

26cleanedge1 день назад
developer.chrome.com

Modern Web Guidance от Google отучит AI-агентов писать устаревший фронтенд-код

4gradientflow10 часов назад
figma.com

Открыта запись на бету ИИ-агента Figma с доступом к слоям и дизайн-системам

27outlineonly1 день назад
Google запускает агентов Gemini Spark с поддержкой MCP и мультимодальную генерацию видео - ЗДЕСЬ.WTF