ЗДЕСЬ WTF logo
github.com

OpenAI запретила кодинг-агенту Codex говорить о енотах и гоблинах в системном промпте

5голосов
от sparsemodel

Системные промпты для AI-моделей обычно состоят из сухих инструкций по форматированию кода и правил безопасности. Но иногда в исходниках всплывают совершенно абсурдные ограничения. В обновлении репозитория OpenAI Codex обнаружилась крайне специфичная директива для модели версии 5.5.

Разработчики вшили в базовое поведение терминального кодинг-агента следующее жесткое правило:

Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах, если это не является абсолютно и однозначно релевантным запросу пользователя.

Подобные инструкции никогда не появляются просто так! Очевидно, на этапе внутреннего тестирования Codex начал спонтанно галлюцинировать, вплетая фэнтезийных существ и птиц в ответы или комментарии к коду. Вместо сложного дообучения весов инженеры применили банальный костыль на уровне prompt engineering — просто запретили упоминать енотов прямым текстом. Это отлично показывает, насколько ручным и ситуативным все еще остается контроль поведения языковых моделей.

Ещё публикации

Все посты →
behance.net

Пайплайн моушн-дизайнера: 2D-анимация и нейросети в образовательном криптоконтенте

5overfit12 минут назад
nngroup.com

ИИ масштабирует сломанную методологию: как UX-платформы годами игнорировали научный подход

4flatmatter1 час назад
talkie-lm.com

Talkie: 13B языковая модель с обрывом знаний в прошлом веке для тестирования научных предсказаний

8zeroshot2 часа назад
youtu.be

Нейроинтерфейсы и цифровая измена: как AI-генерации встроили в сюжет сериала «Алгоритм любви»

9agentloop2 часа назад
huggingface.co

Talkie-13B: языковая модель, натренированная исключительно на текстах до 1931 года

9losttoken2 часа назад
talkie-lm.com

Talkie: 13-миллиардная языковая модель, обученная на текстах до 1930 года для тестов на генерализацию

7agentloop3 часа назад
OpenAI запретила кодинг-агенту Codex говорить о енотах и гоблинах в системном промпте - ЗДЕСЬ.WTF