Принято считать, что идеальный ИИ-агент должен просто вызывать набор нужных API-инструментов в цикле. Так ли это? Perplexity предлагает другой подход, представив архитектуру Search as Code. Вместо последовательных обращений к инструментам, модель генерирует Python-код, который запускается в изолированном sandbox и напрямую работает с поисковым стеком. Этот подход уже используется по умолчанию в их новом интерфейсе Computer.
Идея выглядит логичным шагом для работы со сложными запросами. Агент может параллельно отправлять десятки поисковых вызовов, самостоятельно дедублицировать результаты, фильтровать данные и проводить математические расчеты до того, как вернет финальный ответ. Разработчикам больше не нужно строить хрупкие цепочки из промптов на своей стороне, достаточно включить инструмент в массиве tools и при необходимости добавить флаг background: true для долгих операций.
Правда, делегирование логики внутрь изолированных контейнеров создает новые проблемы в виде непредсказуемого времени выполнения и усложненного дебага. Если скрипт падает с ошибкой в stderr, контейнер завершает работу, а Agent API может просто вернуть неполный результат. К тому же, ценообразование становится многослойным: разработчик платит за токены модели, отдает $0.03 за саму сессию песочницы, а сверху оплачивает каждый вызов внутренних инструментов по отдельным тарифам. Удобная абстракция редко обходится без скрытых издержек.
Поделиться:
Профилировщики llmfit и llm-checker для оценки аппаратной совместимости локальных LLM →
GRAI ищет Senior ML Engineer для разработки рекомендательной системы легального AI-аудио →