Почему ИИ и нейросети не заменят художников в геймдеве

Вернее, заменят, но не всех и не везде — работы художникам и дизайнерам всё равно останется много. Но такая замена точно пойдёт всем на пользу — даже если это сейчас не выглядит так очевидно.

Меня зовут Денис и последние 14 лет я занимаюсь профессиональной разработкой игр. В 2009 году я основал свою первую игровую студию Pragmatix. Сейчас руковожу компанией Green Pixel со штатом в 80 человек с офисом на Кипре. При этом я продолжаю участвовать в каждом этапе при создании новой игры, в том числе — в дизайне и визуальном оформлении.

Мы пробуем, проверяем и применяем все наработки в области дизайна и генерации изображений, которые только появляются в сети. В этой статье я расскажу о применении ИИ для генерации картинок в игровой разработке и о том, как это может помочь стартапам или маленьким командам с небольшим штатом художников. Если после прочтения у вас будет что дополнить или захочется поделиться своим опытом — приходите в комментарии, буду рад ответить.

Сразу обозначу один из ключевых и спорных вопросов индустрии: что важнее всего при создании коммерчески успешной игры, кроме геймплея?

Если опустить геймплей (который никак не оценить без прототипа) и попадание в рынок (а это вообще чистая лотерея), то ответ будет такой:

Для коммерчески успешной игры крайне важна стоимость её разработки. Логика простая: чем меньше вы потратите на разработку игры, тем больше шанс вернуть потраченные на ее деньги, даже если будет мало продаж.

Стоимость разработки любой игры складывается из размера команды, задействованной в ее разработке, умноженной на затраченное на игру время. Получается, что если мы сможем автоматизировать работу части команды — в нашем случае речь про художников — то это позволит нам сократить и сроки запуска продукта, и затраты на зарплату. И вот тут нам на помощь приходит генерация картинок с помощью ИИ.

Совсем недавно генерация картинок нейросетью по текстовому описанию была чем-то из области фантастики. Сегодня это реальность, с которой я познакомился так: листая ленту я наткнулся на пост про сервис MidJourney с примерами сгенерированных изображений. Это взорвало мой мозг и следующую пару недель я провел в Discord, вбивая многочисленные запросы к боту MidJourney для генерации картинок.

MidJourney — программа ИИ, которая работает примерно так же, как DALL-E и Stable Diffusion. Она получает текстовое описание картинки, а потом выдаёт максимально подходящий для него результат.

Я сразу задумался о том, что это можно применить у нас в компании для помощи в работе художников. Ещё две недели я разбирался с тем, как работает бот и как правильно задавать ему вопрос, чтобы получить предсказуемый результат. Предсказуемый — значит тот, который уже можно с минимальной доработкой применить в нашей работе, и подходящий к нужным задачам.

Параллельно с этим мне пришлось потратить много времени на убеждение команды в том, что данный инструмент не призван отнять у них рабочие места. Помогла аналогия с Фотошопом — про него в своё время говорили то же самое, а в итоге он стал обычным рабочим инструментом, который ускоряет работу с изображениями. С нейросетями всё примерно то же самое, но с некоторыми отличиями, о которых расскажу ниже.

Через месяц после того, как мы взяли на вооружение нейросети для художников, оформились такие мысли:

Получить картинку, которую вы нарисовали у себя в голове, да еще и в нужном для игры стиле (и чтобы этот стиль сохранялся от запроса к запросу) — очень сложно, а иногда вообще невозможно. Для этого точно нужен определённый навык построения текста, который надо постоянно развивать.
Скорей всего, мы стоим на пороге появления новой профессии: нейроартист. Это тот, кто не только умеет общаться с ИИ на понятном для нее языке, чтобы получать предсказуемые результаты, но и тот, кто знает в каких случаях какую нейронную сеть использовать. Одни хорошо работают с лицами, вторые могут увеличить разрешение картинки в разы без потери качества, третьи позволяют из скетча генерировать полноценную картинку. Надо подбирать инструмент под задачу, универсального нет.
В идеале, внутри компании нужно организовывать направление по развертыванию на своей инфраструктуре opensource-нейронных сетей, а потом обучать её нужному нам стилю. На это нужны отдельные специалисты, но, кажется, что оно того стоит.
Это инструмент, а не замена, и без художников все равно не обойтись. В любом случае, то, что выдаёт нейросеть, надо дорабатывать под игру. Иногда что-то проще нарисовать, чем придумать правильный запрос к нейронной сети.

Самый главный вывод, к которому я пришел: ИИ для генерации картинок — уже вполне себе рабочий инструмент, игнорировать который точно не стоит.

На самом деле направлений намного больше, чем можно охватить в рамках одной статьи, поэтому приведу только основные.

Генерация внутриигровых иконок и предметов. Вот что получилось сгенерировать у меня для наполнения одной игры:

Почему ИИ и нейросети не заменят художников в геймдеве

Отрисовка загрузочных экранов или фонов для игр. Некоторые игры, например, интерактивные истории, состоят в основном только из фонов, ИИ в данном случае сильно снижает стоимость разработки таких игр:

Подборка игровых иконок для магазинов приложений — AppStore, Google Play, Steam и так далее. В нашем случае сгенерированная за 20 минут иконка дала прирост конверсии в установку игры на 20%. Я слышал истории коллег из индустрии, когда это давало еще больший результат.

Почему нейросеть здесь так хорошо работает? Все просто: нарисовать иконку в хорошем разрешении для магазина приложений займёт, в среднем, одну неделю работы у художника. А на на генерацию иконок с подбором запроса нужно гораздо меньше времени. Чем больше иконок мы протестируем, тем выше вероятность найти ту самую, которая будет хорошо работать для этой игры.

Даже если поднять конверсию всего на 3%, то на этот же процент у нас вырастут органические установки игры. Это означает сразу более дешёвое привлечение через рекламу и увеличение доходов от игры.

Постоянный источник вдохновения. Часто нейронная сеть может нарисовать что-то очень неочевидное, то, что сложно себе представить в принципе. Из-за своей насмотренности она может выйти за рамки привычного воображения. Например, вот вам неочевидный инопланетный робот, каким его видит ИИ:

Спрайты для изометрических игр. Мои собственные попытки сгенерировать изометрические спрайты получились не самыми удачными — по��ти всегда им требовалась доработка художником. Но в дискорде я встречал вполне себе хорошие результаты. Здесь я хочу лишь показать направление, в котором можно экспериментировать:

Персонажи для диалогов. На текущий момент нейросети сложно сказать, какой у персонажа должна быть поза, эмоция и нужный угол поворота, но ИИ может задать направление для работы и упростить задачу художникам. Нейросети позволяют быстро перепробовать несколько вариантов персонажей, остается взять те, что понравились и работать в этом направлении:

Увеличение разрешения картинки. В игровой индустрии часто бывает нужно или полезно увеличить разрешение текстуры или спрайта без потери качества. Это даёт сразу массу плюсов: от банального сокращения времени отрисовки иконки до увеличения разрешения старых игровых текстур, чтобы вдохнуть новую жизнь в старые игры.

Областей применения нейронных сетей для генерации картинок в игровой разработке намного больше, чем перечислено в этой статье. Я лишь обозначаю некоторые направления, к которым пришел сам, и которые уже сегодня мы используем для экономии бюджета разработки игры.

Немного мыслей и прогнозов о том, что нас ждёт в будущем в этом направлении:

Я сильно рассчитываю на развитие направления in-painting, которое уже есть в DALLE-2, а также существует в зачаточном виде в форках Stable diffusion. In-painting — это возможность дорисовывания уже существующего изображения или внесения в него правок. Например, можно стереть голову курицы с фотографии и попросить нейронную сеть дорисовать вместо нее голову робота или собаки.
Уже сейчас можно обучить нейросеть нужному для работы стилю или добавить в нее знание о новых предметах или персонажах для последующего использования этого в генерациях. Это ещё больше упростит работу художников на начальных этапах.
Генерация 3D-объектов по текстовому запросу. Вот что уже есть от DreamFusion на эту тему: Text-to-3D — https://dreamfusion3d.github.io. Осталось дождаться момента, когда это пойдет в массы.
Генерация видео. Это позволит существенно сократить расходы на создание внутриигрового видеоконтента, например, кат-сцен. Я уверен, что это можно будет также применять для создания рекламных креативов в продвижении игр.

Будьте креативными, экспериментируйте с запросами и используйте в них отсылки к работам популярных художников и стилям рисования от Pixel art до Pixar style. Изучайте чужие результаты генераций и их запросы и помните, что нейронные сети не стоят на месте. Даже если сегодня результат ее работы вас не устроил, просто дайте этой технолонии немного времени и попробуйте снова.

Чтобы разобраться в том, какие подходы используют нейроартисты в генерации картинок, я рекомендую использовать поисковую систему работ, созданную с помощью Stable Diffusion: https://lexica.art. Мне в свое время это очень сильно помогло.

Нейронные сети уже сегодня способны сохранить ваше время, а время — это деньги и дополнительные возможности для доработки вашей игры перед ее релизом.

#gamedev #ai #design #геймдев #геймдизайн #ии #нейросети #разработкаигр #художник #дизайн

Почему ИИ и нейросети не заменят художников в геймдеве

Кто я такой и почему могу говорить об этом

Что важно для коммерчески успешной игры

Как это работает в жизни

Итоги экспериментов

Как нейросети могут помочь художникам

Что будет дальше

Итоги