Microsoft Webwright: минималистичный фреймворк для управления браузером через генерацию кода

Это самый изящный подход к браузерным ИИ-агентам из тех, что сейчас есть в опенсорсе. Microsoft открыла исходный код проекта Webwright — минималистичного фреймворка, который дает LLM доступ к терминалу для управления вебом. Вместо того чтобы заставлять нейросеть предсказывать по одному клику или скроллу на каждый кадр страницы, агент пишет полноценные Python-скрипты с использованием playwright. Скрипт запускается, выполняет кусок работы, а если падает — модель читает логи и переписывает код.

Главная фишка здесь в смене парадигмы. Состояние хранится не в хрупкой сессии браузера, а в локальном воркспейсе. Вся кодовая база Webwright умещается примерно в 1500 строк: базовый цикл, CLI и коннекторы к провайдерам. Никаких скрытых слоев оркестрации и графовых движков, только httpx, pydantic и терминал. Такой подход радикально снижает накопление ошибок на длинных дистанциях. Если агенту нужно заполнить сложную форму или спарсить таблицу, он пишет абстракцию и цикл, а не пытается угадать селекторы ста разных инпутов шаг за шагом.

Проект работает как самостоятельный инструмент, но его также можно подключить в виде плагина к Claude Code, Codex или OpenClaw. Модель генерирует логику на лету, тестирует ее в изолированном окружении, а итоговая производительность на реальных бенчмарках обходит тяжеловесные аналоги! Это отличная стартовая площадка для тех, кому нужен прозрачный и рабочий инструмент без лишних абстракций.

Microsoft Webwright: минималистичный фреймворк для управления браузером через генерацию кода

Ещё публикации

Microsoft Webwright: минималистичный фреймворк для управления браузером через генерацию кода

Ещё публикации