Их не остановить - китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.

Их не остановить - китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.
Их не остановить - китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.

Разработчики нейросети отмечают, что Janus Pro — улучшенная версия Janus, который компания выпускала ранее. В обновлении инженеры оптимизировали стратегию обучения, увеличили датасет и масштабировали размер самой модели. Всё это позволило выйти на новый уровень в задачах генерации картинок по текстовому описанию и анализу изображений. В бенчмарках GenEval и DPG-Bench нейросеть превосходит открытую Stable Diffusion 3 Medium и коммерческую DALL-E 3 от OpenAI.

Модель машинного обучения Janus-Pro-7B опубликована на площадке Hugging Face. Команда проекта призывает сторонних исследователей и разработчиков присоединиться к проекту. Код модели открыт и распространяется по лицензии MIT, а сама нейросеть — по лицензии DeepSeek.

В GitHub-репозитории доступна инструкция по локальному запуску нейросети.

Ссылка на демку:

58
14
5
51 комментарий

ясно, запретить нахуй

52
3

Все его попытки:

32

Не... Он должен сказать, что китайцы украли у США эту нейронку.

верим в партию

2
21