NVIDIA улучшила нейросеть GauGAN — теперь она генерирует фотореалистичные изображения на основе текстового описания

Для обучения инструмента использовали больше 10 миллионов картинок.

NVIDIA выпустила первую версию GauGAN в 2019 году, а в ноябре 2021-го представила GauGAN 2. Главным его нововведением стала возможность генерировать изображения на основе не только эскизов, но и текстовых описаний.

Чтобы натренировать GauGAN 2, использовали суперкомпьютер NVIDIA Selene и свыше 10 миллионов высококачественных изображений видов природы. Нейросеть также учили формировать связь между словами и визуальной информацией, работать с текстом, семантической сегментацией, стилистикой, эскизами.

Опробовать GauGAN 2 можно на сайте NVIDIA. Ранее компания также выпустила редактор Canvas, в основе которого используется нейросеть GauGAN.

Собственную нейросеть, генерирующую изображения на основе текста, ранее создал и «Сбер» — его инструмент получил название ruDALL-E, он составляет изображения по описанию на русском.

311311
129 комментариев