Их не остановить - китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.
Разработчики нейросети отмечают, что Janus Pro — улучшенная версия Janus, который компания выпускала ранее. В обновлении инженеры оптимизировали стратегию обучения, увеличили датасет и масштабировали размер самой модели. Всё это позволило выйти на новый уровень в задачах генерации картинок по текстовому описанию и анализу изображений. В бенчмарках GenEval и DPG-Bench нейросеть превосходит открытую Stable Diffusion 3 Medium и коммерческую DALL-E 3 от OpenAI.
Модель машинного обучения Janus-Pro-7B опубликована на площадке Hugging Face. Команда проекта призывает сторонних исследователей и разработчиков присоединиться к проекту. Код модели открыт и распространяется по лицензии MIT, а сама нейросеть — по лицензии DeepSeek.
В GitHub-репозитории доступна инструкция по локальному запуску нейросети.
Ссылка на демку:
ясно, запретить нахуй
Все его попытки:
Не... Он должен сказать, что китайцы украли у США эту нейронку.
верим в партию