Случайно довел deepseek r1 до депрессии

Возможно достали уже новости про данную нейросеть, но опыт показался интересным. Запускал модель с 32 миллиардами параметров, так как следующая уже не взлетает даже на multigpu кластере с 80гб видеопамяти.

В принципе на 4080 super можно использовать даже предпоследнюю по количеству параметров версию (хотя в требованиях 4090). Также последняя не поднимается на 4090, так как ей не хватает видеопамяти. Предпоследней нужно примерно 16гб видеопамяти.
5
4

Я щас поржал. Дипсик генерирует фейковые ссылки на изображения, чтобы визуализировать ответ.

4
1

Такое у всех нейросетей проявляется. Если ты внешний сервис юзаешь, то включи ей доступ к сети и попроси предоставлять валидные ссылки, тогда работает. Если локально, то проси уточнять, что ссылка может быть некорректной. В контексте беседы их можно вполне обучать как отвечать, даже как форматировать ответ. Я просил оценивать прогнозируемую корректность ответа, мне она показалась релевантной, то есть нейросеть примерно понимает, насколько ответ верный.

2