А qwen забыл, да. Смотрю все на китайцев, но что-то не пробовал пока. — Юрий Каменев на DTF

Юрий Каменев

300 грамм кубической муки - тестируем маленькие LLM

- Мама, я хочу ChatGPT!

- У нас есть ChatGPT дома.

Читать далее

77

22

11

Китайцев с qwen 2.5 еще забыли. Тоже релизнули кучу моделей, в том числе мелких. Достаточно неплохие.
И допущена(?) ошибка взять лламу 3.2 на самом деле.
Там 3б модель еще и квантированная.
В идеале бы лламу 3.1. Там 8б и это куда лучше. Во всяком случае таких ошибок как смешивание инглиша и русского она почти не допускает.

1

Ответить

Юрий Каменев

Автор

Llama 3.1 пробовал, но они пяткой в грудь себя бьют, что 3.2 лучшая.

1

Ответить

Юрий Каменев

Автор

А qwen забыл, да. Смотрю все на китайцев, но что-то не пробовал пока.

1

Ответить