Добавить в избранное

Системные промпты для AI-моделей обычно состоят из сухих инструкций по форматированию кода и правил безопасности. Но иногда в исходниках всплывают совершенно абсурдные ограничения. В обновлении репозитория OpenAI Codex обнаружилась крайне специфичная директива для модели версии 5.5.

Разработчики вшили в базовое поведение терминального кодинг-агента следующее жесткое правило:

Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах, если это не является абсолютно и однозначно релевантным запросу пользователя.

Подобные инструкции никогда не появляются просто так! Очевидно, на этапе внутреннего тестирования Codex начал спонтанно галлюцинировать, вплетая фэнтезийных существ и птиц в ответы или комментарии к коду. Вместо сложного дообучения весов инженеры применили банальный костыль на уровне prompt engineering — просто запретили упоминать енотов прямым текстом. Это отлично показывает, насколько ручным и ситуативным все еще остается контроль поведения языковых моделей.

Разработчики вшили в базовое поведение терминального кодинг-агента следующее жесткое правило:

Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах, если это не является абсолютно и однозначно релевантным запросу пользователя.

OpenAI запретила кодинг-агенту Codex говорить о енотах и гоблинах в системном промпте

Ещё публикации

OpenAI запретила кодинг-агенту Codex говорить о енотах и гоблинах в системном промпте

Ещё публикации