300 грамм кубической муки - тестируем маленькие LLM

- Мама, я хочу ChatGPT!

- У нас есть ChatGPT дома.

77
22
11

Китайцев с qwen 2.5 еще забыли. Тоже релизнули кучу моделей, в том числе мелких. Достаточно неплохие.
И допущена(?) ошибка взять лламу 3.2 на самом деле.
Там 3б модель еще и квантированная.
В идеале бы лламу 3.1. Там 8б и это куда лучше. Во всяком случае таких ошибок как смешивание инглиша и русского она почти не допускает.

1
Ответить

Llama 3.1 пробовал, но они пяткой в грудь себя бьют, что 3.2 лучшая.

1
Ответить

А qwen забыл, да. Смотрю все на китайцев, но что-то не пробовал пока.

1
Ответить