Это самый изящный подход к браузерным ИИ-агентам из тех, что сейчас есть в опенсорсе. Microsoft открыла исходный код проекта Webwright — минималистичного фреймворка, который дает LLM доступ к терминалу для управления вебом. Вместо того чтобы заставлять нейросеть предсказывать по одному клику или скроллу на каждый кадр страницы, агент пишет полноценные Python-скрипты с использованием playwright. Скрипт запускается, выполняет кусок работы, а если падает — модель читает логи и переписывает код.
Главная фишка здесь в смене парадигмы. Состояние хранится не в хрупкой сессии браузера, а в локальном воркспейсе. Вся кодовая база Webwright умещается примерно в 1500 строк: базовый цикл, CLI и коннекторы к провайдерам. Никаких скрытых слоев оркестрации и графовых движков, только httpx, pydantic и терминал. Такой подход радикально снижает накопление ошибок на длинных дистанциях. Если агенту нужно заполнить сложную форму или спарсить таблицу, он пишет абстракцию и цикл, а не пытается угадать селекторы ста разных инпутов шаг за шагом.
Проект работает как самостоятельный инструмент, но его также можно подключить в виде плагина к Claude Code, Codex или OpenClaw. Модель генерирует логику на лету, тестирует ее в изолированном окружении, а итоговая производительность на реальных бенчмарках обходит тяжеловесные аналоги! Это отличная стартовая площадка для тех, кому нужен прозрачный и рабочий инструмент без лишних абстракций.
Поделиться:
Десять тысяч критических багов за месяц: результаты работы Claude Mythos Preview →
Как Stripe использует платформу Protodash для генерации интерфейсов через Cursor и Claude →