Kristaller_neuralnews: статьи и новости по теме — DTF

OpenChat 3.5: дообученная Miatral-7B, которая бьёт ChatGPT по почти всем бенчмаркам и превосходит базовые 70B модели

Авторы использовали собственную технику обучения C-RLFT, смысл который в том, чтобы отдавать предпочтение при обучении более качественным данным (в частности, сгенерированных GPT-4) относительно всех остальных.

OpenChat 3.5: дообученная Miatral-7B, которая бьёт ChatGPT по почти всем бенчмаркам и превосходит базовые 70B модели

Читать далее

10

ETH VIS Group смогли улучшить Segment Anything Model для точного определения границ

Впечатляющих результатов удалось достичь всего за 200$

ETH VIS Group смогли улучшить Segment Anything Model для точного определения границ

Читать далее

Вчера лучшая языковая модель с открытым исходным кодом сменила лицензию

И речь не про LLaMA

Вчера лучшая языковая модель с открытым исходным кодом сменила лицензию

Читать далее

5

Исследователи из CMU смогли научить большую языковую модель генерировать изображения

Генерация происходит благодаря Stable Diffusion, но лучше!

Читать далее

6