Используем локальные LLM для помощи в разработке

Я долгое время использовал IDE Cursor, которая предоставляет встроенную поддержку языковых моделей (LLM) для написания кода. Хотя это мощный инструмент, он накладывает слишком жесткие лимиты в бесплатной версии. Я решил изучить возможность использования локальных языковых моделей внутри Cursor, но, к сожалению, так и не смог найти подходящее решение. Однако в процессе поиска наткнулся на интересную альтернативу, которую теперь активно использую.

Как это работает:

1. LM Studio

Я настроил локальный сервер с помощью LM Studio. Этот инструмент позволяет запускать локальные языковые модели, что особенно полезно для задач, связанных с конфиденциальностью и производительностью.

2. Visual Studio Code + Continue

Вместо Cursor я теперь использую Visual Studio Code с расширением Continue, которое позволяет подключить LLM к редактору кода. Это расширение хорошо поддерживает интеграцию с локальными моделями, в том числе с API сервера LM Studio.

3. Модель T-Lite 7b

В качестве языковой модели я выбрал T-Lite с 7 миллиардами параметров. T-Lite и T-Pro — модели на 7 и 32 млрд параметров соответственно, построенные на базе моделей Qwen 2.5 и дообученные на русский язык.

Если вы хотите попробовать что-то подобное, рекомендую начать с LM Studio и посмотреть, какие модели подойдут для ваших задач. У меня 8 Гб видеопамяти и 16 оперативной, и этого вплотную хватает, чтобы запустить одновременно Unity, VS Code, Photoshop и LM Studio с моделью T-Lite. Если у вас больше видеопамяти, советую присмотреться к модели Qwen2.5-Coder-32B-Instruct.

22
7 комментариев

Если ты программист, то использовать английский язык надо всегда. По запросам на русском языке эти модели часто выдают либо чушь, либо сильно ограничены в данных.

Да? Вы проверяли?
Я просто думал, там уже плюс-минус паритет...

Почему именно Т-Lite, а не LLama например?
Я как то пробовал заняться чем то подобным, но для этого надо было дообучить модель, чтобы она была заточена чисто под мои нужды. Стал разбираться, понял что нужно собрать и оформить датасет (на хаггингфейсе нужного не нашел). Как это грамотно сделать я так и не понял, везде по разному пишут. + после дообучения надо же ее как то настраивать еще, веса всякие и т.д.

Как это грамотно сделать я так и не понял, везде по разному пишут. + после дообучения надо же ее как то настраивать еще, веса всякие и т.д.вам нужен маг-кудескник с зп 300к/наносек

T-Lite разве заточена под код? Я просто взял Qwen 2.5 Coder – именно потому, что она заточена под код и умеет в ентот самый FIM, который вроде как желателен для автодополнения кода.