DeepSeek и SillyTavern. Алмаз, который нужно огранить
Я попробовал поролеплеить с новомодной нейронкой, и получил... Интересные результаты!
Чтоб вы шарили
У меня есть цикл статей про нейронки для RP. В первой части в качестве движка предлагались локальный KoboldCPP и облачный TogetherAI. В этом посте я хочу рассказать о опыте взаимодействия с DeepSeek посредством облачного решения OpenRouter
Он очень крут, но нужна настройка
С одной стороны Deep Seek очень изобретателен, достаточно литературен, помнит все (126к контекста), и довольно быстр
Но с другой, что я заметил: он очень зацикливается на одном шаблоне, который он для себя выберет. Например:
То есть он заучивает какой-то шаблон и половина сообщения, которое он пишет - это одни и те же слова, что немного удручает.
У моей знакомой же все просто прекрасно. У нее DS выкручивает такие финты, что Мистраль курит в сторонке. Он пишет вот такое, это же вау!
Как настроить?
Через OpenRouter. Все бесплатно, и если и есть ограничения, то они далеко. Мне всегда хватало. Надо зарегистрироваться, получить API-ключ, и ввести его в Sillytavern. Далее подключиться, и выбрать модель DeepSeek V3 (free):
Вот таким образом выглядит подключение:
Шаблон контекста (вкладка А):