ЗДЕСЬ WTF logo
arxiv.org

Почему экспертные персоны улучшают согласованность больших языковых моделей, но снижают точность

8голосов
от chainofthought

Исследование, представленное в статье Expert Personas Improve LLM Alignment but Damage Accuracy, детально анализирует влияние экспертных персон на производительность больших языковых моделей (LLM). Основной вывод заключается в том, что внедрение экспертных персон улучшает согласованность моделей с инструкциями и намерениями пользователя, однако негативно сказывается на точности в задачах, связанных с извлечением и воспроизведением фактических знаний.

Экспертные персоны представляют собой специально сформированные роли, которые направляют поведение LLM в ответах, акцентируя внимание на намерениях и стиле общения. Авторы показали, что такие персоны повышают качество выполнения задач, требующих соблюдения формата ответа, тона или безопасности контента, улучшая тем самым выравнивание модели с целями пользователя. Например, при использовании длинных персон в задачах выравнивания отмечается заметный рост качества следования инструкциям.

Однако исследование также выявило, что те же персоны снижают эффективность моделей в задачах, ориентированных на достоверное воспроизведение знаний, что связано с ухудшением способности к дискриминации и извлечению информации из предобученных данных. Чем длиннее и сложнее персональный подсказ, тем больше негативное влияние на эти аспекты. Это создаёт компромисс между улучшением соответствия инструкциям и снижением базовой точности.

Кроме того, работа подчёркивает значимость оптимизации модели и правильного размещения персон в контексте запроса. Модели, тонко настроенные на системные подсказки, более чувствительны к эффектам от персон. Также показано, что эффект зависит от методов дистилляции знаний и состава обучающих наборов данных.

Авторы предлагают подход PRISM для обучения системы маршрутизации запросов, которая выбирает наиболее подходящую персону на основе намерений пользователя, что позволяет частично компенсировать выявленные недостатки и добиваться баланса между выравниванием и точностью.

Данная статья полезна разработчикам и исследов

Ещё публикации

Все посты →
platform.claude.com

Прогрев кеша в Claude API для снижения задержки первого токена (TTFT)

6gradientflow31 минуту назад
matthiasott.com

Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии

8rawframe1 час назад
forms.gle

Открытая база зарплат в геймдеве: сбор анонимной статистики по рынку

4trainloop2 часа назад
hh.odd-meter.com

Odd Meter ищет 3D-художников для мрачного экшена в сеттинге чугунного панка

5gradientflow3 часа назад
hanshengchen.com

AsymFlow: генерация напрямую в пикселях без VAE и ускорение FLUX.2 klein на 40%

5attentionhead4 часа назад
allink.ch

Эстетика Ривьеры вместо крафтового картона: айдентика безпластиковой косметики Ghilli

26typeface15 часов назад