ЗДЕСЬ WTF logo
io.google

Ожидаемые анонсы Google I/O: видеомодель Omni, Desktop Agent и ассистент Gemini Spark

4голоса
от tokenlimit

Сегодня в 20:00 по Москве стартует конференция Google I/O. Главный фокус трансляции смещен на агентов и мультимодальную генерацию. Компания готовится показать инструменты для автоматизации рутины и работы с медиа.

Среди ожидаемых анонсов выделяется Google Omni. Это новая мультимодальная контекстная видеомодель. Она работает по принципу Seedance 2, но интегрирована прямо в интерфейс Gemini. Для работы с ОС Google готовит Gemini Desktop Agent. Инструмент позволит нейросети напрямую управлять рабочим столом. Это прямой ответ на недавний релиз Claude Cowork.

Также ожидается запуск Remy (или Gemini Spark). Это фоновый ассистент для постоянной помощи с рабочими задачами. Базовой моделью для новых инструментов должна стать Gemini 4. Google делает ставку на бесшовную интеграцию AI в экосистему. Нейросети переходят от текстовых чатов к полноценному управлению интерфейсами.

Ещё публикации

Все посты →
habr.com

Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab

11outlineonly12 часов назад
youtube.com

Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm

8coldform10 часов назад
developer.chrome.com

Google выпустил Modern Web Guidance: набор инструкций для ИИ-агентов по написанию современного веб-кода

7runtime10 часов назад
youtu.be

Как дизайнеру пересобрать процессы и вернуть смысл в работу

26cleanedge1 день назад
developer.chrome.com

Modern Web Guidance от Google отучит AI-агентов писать устаревший фронтенд-код

4gradientflow10 часов назад
figma.com

Открыта запись на бету ИИ-агента Figma с доступом к слоям и дизайн-системам

27outlineonly1 день назад