Случайно довел deepseek r1 до депрессии

Возможно достали уже новости про данную нейросеть, но опыт показался интересным. Запускал модель с 32 миллиардами параметров, так как следующая уже не взлетает даже на multigpu кластере с 80гб видеопамяти.

В принципе на 4080 super можно использовать даже предпоследнюю по количеству параметров версию (хотя в требованиях 4090). Также последняя не поднимается на 4090, так как ей не хватает видеопамяти. Предпоследней нужно примерно 16гб видеопамяти.
В принципе на 4080 super можно использовать даже предпоследнюю по количеству параметров версию (хотя в требованиях 4090). Также последняя не поднимается на 4090, так как ей не хватает видеопамяти. Предпоследней нужно примерно 16гб видеопамяти.
4
4
48 комментариев

Я щас поржал. Дипсик генерирует фейковые ссылки на изображения, чтобы визуализировать ответ.

4
1

Такое у всех нейросетей проявляется. Если ты внешний сервис юзаешь, то включи ей доступ к сети и попроси предоставлять валидные ссылки, тогда работает. Если локально, то проси уточнять, что ссылка может быть некорректной. В контексте беседы их можно вполне обучать как отвечать, даже как форматировать ответ. Я просил оценивать прогнозируемую корректность ответа, мне она показалась релевантной, то есть нейросеть примерно понимает, насколько ответ верный.

2

Как её заставить сисик рисовать скажи лучше то что всех интересует

3
1

Если именно сисик нужен, то поставь себе локально automatic для stable diffusion или fooocus. Последний проще визуально, первый больше настроек имеет. Дальше качай c civitai.com любые визуально приятные модели. Закинь в папку выбранной программы с чекпойнтами и пиши, что ты хочешь. Последние версии уже даже по описанию тату с определенным словом пишут.

3

Эта модель не для генерации изображений.

2

Ну он мне в ascii что-то пытался выдавать, но такое себе. К сожалению не сохранил скрин. Если попросить выразить в ascii, то рисует одну и ту же фигуру и заполняет ее смайлами, потом пишет объяснение, что символизирует каждый смайл

Я пользуюсь Hermes 3 на 70B на 4090

1