Я пользуюсь Hermes 3 на 70B на 4090 — 🌈 Петр Радько на DTF

Кубит

Офтоп

29 янв

Случайно довел deepseek r1 до депрессии

В принципе на 4080 super можно использовать даже предпоследнюю по количеству параметров версию (хотя в требованиях 4090). Также последняя не поднимается на 4090, так как ей не хватает видеопамяти. Предпоследней нужно примерно 16гб видеопамяти.

🌈 Петр Радько

29 янв

Я пользуюсь Hermes 3 на 70B на 4090

Ответить

Кубит

29 янв

Автор

Насколько он хорош по контексту? До этого юзал llama 3.2, тот вспоминал контекст и подшучивал про предыдущие обсуждения в общем контексте даже спустя десятки обсуждений. deepseek мне утверждал, что контекст у него 2048 токенов, но не очень верится, так как он тоже упоминает контекст сообщений, которые были десятки сообщений назад. И достаточно гибкий, когда я попросил его выводить вероятность ошибки его ответа, он мне ее выводил достаточно достоверно.

3Q?