Локальный DeepSeek R1 32B + Openwebui
5

Это на какой видеокарте???

1

4090. и exl2 квант который работает в связке с драфт моделью, ускоряя скорость вывода до 80-90т/c

1