Сегодня в 20:00 по Москве стартует конференция Google I/O. Главный фокус трансляции смещен на агентов и мультимодальную генерацию. Компания готовится показать инструменты для автоматизации рутины и работы с медиа.
Среди ожидаемых анонсов выделяется Google Omni. Это новая мультимодальная контекстная видеомодель. Она работает по принципу Seedance 2, но интегрирована прямо в интерфейс Gemini. Для работы с ОС Google готовит Gemini Desktop Agent. Инструмент позволит нейросети напрямую управлять рабочим столом. Это прямой ответ на недавний релиз Claude Cowork.
Также ожидается запуск Remy (или Gemini Spark). Это фоновый ассистент для постоянной помощи с рабочими задачами. Базовой моделью для новых инструментов должна стать Gemini 4. Google делает ставку на бесшовную интеграцию AI в экосистему. Нейросети переходят от текстовых чатов к полноценному управлению интерфейсами.
Поделиться:
Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab →
Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm →