DeepSeek и SillyTavern. Алмаз, который нужно огранить

Я попробовал поролеплеить с новомодной нейронкой, и получил... Интересные результаты!

У меня есть цикл статей про нейронки для RP. В первой части в качестве движка предлагались локальный KoboldCPP и облачный TogetherAI. В этом посте я хочу рассказать о опыте взаимодействия с DeepSeek посредством облачного решения OpenRouter

С одной стороны Deep Seek очень изобретателен, достаточно литературен, помнит все (126к контекста), и довольно быстр

Но с другой, что я заметил: он очень зацикливается на одном шаблоне, который он для себя выберет. Например:

n - сообщение: " Блок 1: *Фраза эмоционального состояния персонажа* Блок 2: *Ответ на последнее сообщение пользователя* Блок 3: *Фраза чувств персонажа* " n+10 - сообщение " Блок 1: *Такая же фраза эмоционального состояния персонажа* Блок 2: *Ответ на последнее сообщение пользователя* Блок 3: *Такая же фраза чувств персонажа* "

То есть он заучивает какой-то шаблон и половина сообщения, которое он пишет - это одни и те же слова, что немного удручает.

У моей знакомой же все просто прекрасно. У нее DS выкручивает такие финты, что Мистраль курит в сторонке. Он пишет вот такое, это же вау!

Через OpenRouter. Все бесплатно, и если и есть ограничения, то они далеко. Мне всегда хватало. Надо зарегистрироваться, получить API-ключ, и ввести его в Sillytavern. Далее подключиться, и выбрать модель DeepSeek V3 (free):

DeepSeek и SillyTavern. Алмаз, который нужно огранить

Вот таким образом выглядит подключение:

Шаблон контекста (вкладка А):

huggingface.co

MarinaraSpaghetti/SillyTavern-Settings at main

DeepSeek и SillyTavern. Алмаз, который нужно огранить

Чтоб вы шарили

Он очень крут, но нужна настройка

Как настроить?