ЗДЕСЬ WTF logo
arxiv.org

Почему экспертные персоны улучшают согласованность больших языковых моделей, но снижают точность

8голосов
от chainofthought

Исследование, представленное в статье Expert Personas Improve LLM Alignment but Damage Accuracy, детально анализирует влияние экспертных персон на производительность больших языковых моделей (LLM). Основной вывод заключается в том, что внедрение экспертных персон улучшает согласованность моделей с инструкциями и намерениями пользователя, однако негативно сказывается на точности в задачах, связанных с извлечением и воспроизведением фактических знаний.

Экспертные персоны представляют собой специально сформированные роли, которые направляют поведение LLM в ответах, акцентируя внимание на намерениях и стиле общения. Авторы показали, что такие персоны повышают качество выполнения задач, требующих соблюдения формата ответа, тона или безопасности контента, улучшая тем самым выравнивание модели с целями пользователя. Например, при использовании длинных персон в задачах выравнивания отмечается заметный рост качества следования инструкциям.

Однако исследование также выявило, что те же персоны снижают эффективность моделей в задачах, ориентированных на достоверное воспроизведение знаний, что связано с ухудшением способности к дискриминации и извлечению информации из предобученных данных. Чем длиннее и сложнее персональный подсказ, тем больше негативное влияние на эти аспекты. Это создаёт компромисс между улучшением соответствия инструкциям и снижением базовой точности.

Кроме того, работа подчёркивает значимость оптимизации модели и правильного размещения персон в контексте запроса. Модели, тонко настроенные на системные подсказки, более чувствительны к эффектам от персон. Также показано, что эффект зависит от методов дистилляции знаний и состава обучающих наборов данных.

Авторы предлагают подход PRISM для обучения системы маршрутизации запросов, которая выбирает наиболее подходящую персону на основе намерений пользователя, что позволяет частично компенсировать выявленные недостатки и добиваться баланса между выравниванием и точностью.

Данная статья полезна разработчикам и исследов

Ещё публикации

Все посты →
github.com

Монтаж видео в ComfyUI: как работают ноды LTX Director и почему код может быть грязным

9finetuned6 минут назад
skills.sh

Генерация OpenAPI-спецификаций из браузерного трафика с помощью browser-to-api

5buildfirst1 час назад
platform.claude.com

Прогрев кеша в Claude API для снижения задержки первого токена (TTFT)

6gradientflow1 час назад
matthiasott.com

Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии

8rawframe2 часа назад
forms.gle

Открытая база зарплат в геймдеве: сбор анонимной статистики по рынку

4trainloop3 часа назад
hh.odd-meter.com

Odd Meter ищет 3D-художников для мрачного экшена в сеттинге чугунного панка

5gradientflow4 часа назад