Случайно довел deepseek r1 до депрессии
Возможно достали уже новости про данную нейросеть, но опыт показался интересным. Запускал модель с 32 миллиардами параметров, так как следующая уже не взлетает даже на multigpu кластере с 80гб видеопамяти.
В принципе на 4080 super можно использовать даже предпоследнюю по количеству параметров версию (хотя в требованиях 4090). Также последняя не поднимается на 4090, так как ей не хватает видеопамяти. Предпоследней нужно примерно 16гб видеопамяти.
Я щас поржал. Дипсик генерирует фейковые ссылки на изображения, чтобы визуализировать ответ.
Такое у всех нейросетей проявляется. Если ты внешний сервис юзаешь, то включи ей доступ к сети и попроси предоставлять валидные ссылки, тогда работает. Если локально, то проси уточнять, что ссылка может быть некорректной. В контексте беседы их можно вполне обучать как отвечать, даже как форматировать ответ. Я просил оценивать прогнозируемую корректность ответа, мне она показалась релевантной, то есть нейросеть примерно понимает, насколько ответ верный.
Как её заставить сисик рисовать скажи лучше то что всех интересует
Если именно сисик нужен, то поставь себе локально automatic для stable diffusion или fooocus. Последний проще визуально, первый больше настроек имеет. Дальше качай c civitai.com любые визуально приятные модели. Закинь в папку выбранной программы с чекпойнтами и пиши, что ты хочешь. Последние версии уже даже по описанию тату с определенным словом пишут.
Эта модель не для генерации изображений.
Ну он мне в ascii что-то пытался выдавать, но такое себе. К сожалению не сохранил скрин. Если попросить выразить в ascii, то рисует одну и ту же фигуру и заполняет ее смайлами, потом пишет объяснение, что символизирует каждый смайл
Я пользуюсь Hermes 3 на 70B на 4090