Возможно достали уже новости про данную нейросеть, но опыт показался интересным. Запускал модель с 32 миллиардами параметров, так как следующая уже не взлетает даже на multigpu кластере с 80гб видеопамяти.
Такое у всех нейросетей проявляется. Если ты внешний сервис юзаешь, то включи ей доступ к сети и попроси предоставлять валидные ссылки, тогда работает. Если локально, то проси уточнять, что ссылка может быть некорректной. В контексте беседы их можно вполне обучать как отвечать, даже как форматировать ответ. Я просил оценивать прогнозируемую корректность ответа, мне она показалась релевантной, то есть нейросеть примерно понимает, насколько ответ верный.
Я щас поржал. Дипсик генерирует фейковые ссылки на изображения, чтобы визуализировать ответ.
Такое у всех нейросетей проявляется. Если ты внешний сервис юзаешь, то включи ей доступ к сети и попроси предоставлять валидные ссылки, тогда работает. Если локально, то проси уточнять, что ссылка может быть некорректной. В контексте беседы их можно вполне обучать как отвечать, даже как форматировать ответ. Я просил оценивать прогнозируемую корректность ответа, мне она показалась релевантной, то есть нейросеть примерно понимает, насколько ответ верный.