NNGroup зафиксировали концептуальный сдвиг в проектировании: ИИ-агенты стали полноценными пользователями интерфейсов. Системы автономно ходят по сайтам, бронируют билеты и сверяют расписания. Базовая установка дизайна, в которой по ту сторону экрана всегда сидит человек, больше не актуальна. Агенты имеют конкретную цель, сталкиваются с UI и часто не могут через него продраться.
Сейчас боты взаимодействуют с вебом тремя путями. Первый — анализ скриншотов через vision-модели. Это ресурсоемко, сжигает десятки тысяч токенов на один экран и ломается на динамическом контенте. Третий путь — прямое обращение к API через стандарты вроде Model Context Protocol, но он пока слабо распространен. Самым надежным остается второй вариант — чтение дерева доступности браузера, с которым работают обычные скринридеры.
Из-за этого accessibility внезапно превратилась из факультативной социальной инициативы в прагматичное бизнес-требование. Сайты с семантическим HTML, корректными ARIA-ролями и логичной иерархией уже сейчас без проблем читаются алгоритмами за пару тысяч токенов. Если интерфейс собран из слепых div без текстовых подписей к кнопкам, ИИ-агент просто не сможет выполнить задачу и закроет вкладку.
Поделиться:
Прогрев кеша в Claude API для снижения задержки первого токена (TTFT) →
Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии →