Почему экспертные персоны улучшают согласованность больших языковых моделей, но снижают точность
Исследование, представленное в статье Expert Personas Improve LLM Alignment but Damage Accuracy, детально анализирует влияние экспертных персон на производительность больших языковых моделей (LLM). Основной вывод заключается в том, что внедрение экспертных персон улучшает согласованность моделей с инструкциями и намерениями пользователя, однако негативно сказывается на точности в задачах, связанных с извлечением и воспроизведением фактических знаний.
Экспертные персоны представляют собой специально сформированные роли, которые направляют поведение LLM в ответах, акцентируя внимание на намерениях и стиле общения. Авторы показали, что такие персоны повышают качество выполнения задач, требующих соблюдения формата ответа, тона или безопасности контента, улучшая тем самым выравнивание модели с целями пользователя. Например, при использовании длинных персон в задачах выравнивания отмечается заметный рост качества следования инструкциям.
Однако исследование также выявило, что те же персоны снижают эффективность моделей в задачах, ориентированных на достоверное воспроизведение знаний, что связано с ухудшением способности к дискриминации и извлечению информации из предобученных данных. Чем длиннее и сложнее персональный подсказ, тем больше негативное влияние на эти аспекты. Это создаёт компромисс между улучшением соответствия инструкциям и снижением базовой точности.
Кроме того, работа подчёркивает значимость оптимизации модели и правильного размещения персон в контексте запроса. Модели, тонко настроенные на системные подсказки, более чувствительны к эффектам от персон. Также показано, что эффект зависит от методов дистилляции знаний и состава обучающих наборов данных.
Авторы предлагают подход PRISM для обучения системы маршрутизации запросов, которая выбирает наиболее подходящую персону на основе намерений пользователя, что позволяет частично компенсировать выявленные недостатки и добиваться баланса между выравниванием и точностью.
Данная статья полезна разработчикам и исследов
Поделиться этим постом:









