Локальная модель Gemini Heretic: 40B параметров, логика рассуждений и полное снятие цензуры

Энтузиасты объединили архитектуру Gemma 3 с логикой рассуждений Gemini, выпустив полностью расцензуренную локальную модель. Сборка Gemini-Heretic-Uncensored-Thinking построена на расширенной до 40 миллиардов параметров базе Gemma 3. Автор дообучил ее на датасете Gemini Reasoning через библиотеку Unsloth, добавив открытой модели то, чего ей не хватало по умолчанию — способность к глубокому поэтапному мышлению.

Главная особенность релиза заключается во встроенном механизме рассуждений. Перед выдачей ответа нейросеть формирует детальный внутренний монолог внутри тегов <think>, где планирует структуру кода или текста, анализирует контекст и оценивает варианты. Контекстное окно поддерживает до 128K токенов. При этом из модели вырезали все фильтры безопасности — она игнорирует любые этические рамки и напрямую генерирует контент по запросу без нравоучений.

Для запуска на локальном железе рекомендуется использовать квантование формата Q4KS или IQ3_S. Если в процессе долгого диалога модель начинает терять фокус и переходит к коротким ответам без размышлений, разработчик советует добавлять в промпт триггер think deeply. Это принудительно возвращает нейросеть в режим аналитики и заставляет снова подробно проговаривать свои шаги.

Локальная модель Gemini Heretic: 40B параметров, логика рассуждений и полное снятие цензуры

Ещё публикации

Локальная модель Gemini Heretic: 40B параметров, логика рассуждений и полное снятие цензуры

Ещё публикации