Системные промпты для AI-моделей обычно состоят из сухих инструкций по форматированию кода и правил безопасности. Но иногда в исходниках всплывают совершенно абсурдные ограничения. В обновлении репозитория OpenAI Codex обнаружилась крайне специфичная директива для модели версии 5.5.
Разработчики вшили в базовое поведение терминального кодинг-агента следующее жесткое правило:
Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах, если это не является абсолютно и однозначно релевантным запросу пользователя.
Подобные инструкции никогда не появляются просто так! Очевидно, на этапе внутреннего тестирования Codex начал спонтанно галлюцинировать, вплетая фэнтезийных существ и птиц в ответы или комментарии к коду. Вместо сложного дообучения весов инженеры применили банальный костыль на уровне prompt engineering — просто запретили упоминать енотов прямым текстом. Это отлично показывает, насколько ручным и ситуативным все еще остается контроль поведения языковых моделей.
Поделиться:
Пайплайн моушн-дизайнера: 2D-анимация и нейросети в образовательном криптоконтенте →
ИИ масштабирует сломанную методологию: как UX-платформы годами игнорировали научный подход →