Смогут ли нейросети «оживить» диалоги в играх

Смогут ли нейросети «оживить» диалоги в играх

Диалоги с неигровыми персонажами (NPC) основаны на скриптах. Эта ограниченность делает беседы предсказуемыми, если не сказать — скучными. Некоторые эксперты считают, что искусственный интеллект позволит создать по-настоящему живых персонажей. Они будут реалистично реагировать на любые действия и даже голосовые запросы игроков. Но так ли хороша эта затея? Будет ли она работать на практике? И вообще, реально ли запихнуть нейронную сеть внутрь игры?

NPC играют важную роль в создании правильной игровой атмосферы. Добавляют глубины игровому процессу, раскрывают лор и помогают игроку почувствовать себя частью виртуального мира, выступая в роли своеобразных посредников. Взаимодействие с ними делает приключение более реалистичным и эмоционально насыщенным. Представьте, как выглядела бы ваша любимая игра без «неписей». Ну совсем не то получилось бы.

Однако традиционные NPC обладают множеством ограничений. Построенные на скриптах, они действуют по заранее прописанным разработчиками сценариям. Это сильно сужает их способность реагировать на непредсказуемые действия игрока. В какой-то момент диалоги начинают повторяться или зацикливаться. И это уже не погружает в атмосферу виртуального мира, а только раздражает.

NPC в игре Skyrim
NPC в игре Skyrim

Краткая эволюция NPC

Сегодня NPC — неотъемлемая часть большинства игр. Это могут быть второстепенные персонажи с парой прописанных фраз. А могут быть и ключевые участники основного сюжета с собственной аркой. Но изначально NPC были лишь примитивными объектами, вроде декораций, и выполняли строго определённые ограниченные функции. Так с чего всё началось?

В 1975 вышла игра Colossal Cave Adventure с текстовым интерфейсом. Задача игрока заключалась в исследовании подземелий, обнаружении сокровищ и получении очков. Взаимодействие с игрой строилось на вводе текстовых команд. Во многом благодаря популярности Colossal Cave Adventure возник совершенно новый жанр под названием MUD (multi-user dungeon). Игроки могли в кооперативе проходить лабиринты, искать сокровища и общаться с разными персонажами. Можно сказать, что это был прообраз первых NPC в видеоиграх.

Colossal Cave Adventure (1975)
Colossal Cave Adventure (1975)

А в 1985 году выходит Habitat для компьютеров Commodore 64 — первая MMORPG с полноценной графикой. Игроки находились в одном виртуальном пространстве, могли общаться между собой и с NPC, обмениваться ресурсами, создавать персонажей и обустраивать интерьеры своих домов. Эта игра важна в нашей истории потому, что стала первым проектом, в котором появились прописанные и визуально стилизованные линейные диалоги.

Habitat (1985), первые графические диалоги
Habitat (1985), первые графические диалоги

В этом же году выходит Ultima IV: Quest of the Avatar. Игра стала прорывом во многом благодаря своему сюжету. Диалоги всё ещё вводились с помощью текста. Зато неигровым персонажам начали уделять гораздо больше внимания. Также разработчики добавили в проект уникальную по тем временам механику изменения репутации.

Ultima IV: Quest of the Avatar (1985)
Ultima IV: Quest of the Avatar (1985)

В 90-е годы диалоги и взаимодействия с NPC стали важной, если не сказать неотъемлемой частью RPG-игр. В Baldur’s Gate, например, NPC могли запоминать действия игрока и по-своему реагировать на них в будущем. Это стало важным этапом в развитии неигровых персонажей, которые, наконец-то, перестали быть просто элементами декораций.

Baldur’s Gate (1998)
Baldur’s Gate (1998)

Способы взаимодействия с NPC

Линейные диалоги

В первых играх с NPC разработчики использовали линейные диалоги. Это простейшая форма взаимодействия. Персонаж предоставляет игроку информацию или выдаёт задание по заранее прописанному сценарию. Фраза за фразой в предопределённой последовательности. Такой подход используют в большинстве игр из-за простоты его реализации. Однако линейные диалоги сильно ограничивают свободу игрока. Он становится пассивным участником, просто следуя заранее заданным условиям.

Red Dead Redemption 2 (2018), разработчики отлично прописали не только сюжетных персонажей, но и NPC
Red Dead Redemption 2 (2018), разработчики отлично прописали не только сюжетных персонажей, но и NPC

Если в диалогах нет цели, они превращаются в бессмысленные разговоры. Но это не всегда плохо. Часто с их помощью разработчики раскрывают лор игры. Игрок может блуждать по виртуальным просторам и просто общаться с его обитателями. Или даже подслушивать чужие диалоги. Даже случайные реплики добавляют глубины игровому миру. Он ощущается живым, а не просто статичной декорацией.

Mafia II (2010)
Mafia II (2010)

«Ветвистые» диалоги

«Ветвистые» диалоги предоставляют больше свободы выбора. На экране появляются несколько вариантов ответа. Они могут влиять на на развитие отношений с NPC, но не всегда — на сюжет. Пример — игра Life is Strange (2015), где каждый выбор игрока определяет развитие отношений. Однако даже «ветвистые» диалоги имеют ограничения. NPC по-прежнему действуют в рамках заранее прописанных сценариев и не могут выйти за их пределы. Такие диалоги дают возможность очень ограниченно влиять на развитие истории, создавая иллюзию интерактивности и свободы выбора без особого выбора.

Life Is Strange (2015)
Life Is Strange (2015)

Диалоги, которые влияют на сюжет

Некоторые проекты, например, Detroit: Become Human (2018), выводят идею «ветвистых» диалогов на новый уровень. Здесь практически любой выбор игрока имеет глобальные последствия. Каждая реплика, каждое действие в дальнейшем формируют уникальное повествование. Но на деле речь снова идёт лишь об иллюзии свободы. Ведь мы по-прежнему ограничены заранее прописанными сценариями. Игры вроде Detroit очень сложны в разработке. Потому что приходится проектировать, отрисовывать, анимировать и озвучивать огромное количество всевозможных последствий решений игрока.

Detroit: Become Human (2018), дерево ветвления сюжета
Detroit: Become Human (2018), дерево ветвления сюжета

Динамические диалоги

Современные технологии способны генерировать уникальные реплики NPC в реальном времени. Например, Ubisoft Neo NPC и платформа Convai (для создания 3D-персонажей) позволяют неигровым персонажам адаптироваться к вашим ответам. NPC запоминают все прошлые беседы с игроком и пытаются выстраивать на их основе новые и уникальные диалоги. Они также адекватно реагируют на ваши действия. К сожалению, подобные технологии в данный момент времени далеки от совершенства. Большинство NPC ведут себя просто как «говорящая голова», которая не ведёт игрока по истории, а просто генерирует запросы.

Техническое демо с участием Bloom — NPC, управляемого искусственным интеллектом
Техническое демо с участием Bloom — NPC, управляемого искусственным интеллектом

Развитие NPC на основе нейронных сетей

Переход к динамическим системам

Генеративные модели вроде ChatGPT и другие нейронные сети открывают новые возможности для взаимодействия с NPC. Они позволяют «неписям» анализировать контекст, запоминать действия игрока, создавать уникальные ответы и реакции. Потенциально такие персонажи могут вести беседы, которые никогда не повторяются. Подстраиваться под настроение или отыгрыш игрока и создавать ощущение по-настоящему живого общения. Но пока всё это больше на уровне теории.

Созданием ИИ для персонажей активно занимается корпорация NVIDIA. Она уже стала ключевым разработчиком инструментов для создания ботов. Например, технологии Avatar Cloud Engine (ACE), созданной совместно с калифорнийской компанией Inworld AI. На основе инструмента разработчики создают реалистично анимированных персонажей. Управляются они искусственным интеллектом и в реальном времени реагируют на решения пользователя.

Avatar Cloud Engine (ACE) позволяет создавать не только NPC. Вы можете создать себе аватара для конференции или помощника для приложения
Avatar Cloud Engine (ACE) позволяет создавать не только NPC. Вы можете создать себе аватара для конференции или помощника для приложения

Одна из ключевых составляющих ACE — инструмент NVIDIA NeMo. Решение позволяет разработчикам настраивать большие языковые модели под уникальные требования конкретной игры. С помощью NeMo можно снабдить NPC его предысторией и тонко настроить характер. Поведение и диалоги становятся более осмысленными и соответствуют контексту игрового мира. Более того, в NeMo есть механизм Guardrails, который защищает игроков от нежелательного или небезопасного контента.

Схема работы программы NVIDIA NeMo
Схема работы программы NVIDIA NeMo

Реализовать естественные разговоры в реальном времени помогает технология NVIDIA Riva. Инструмент сочетает функции автоматического распознавания и синтеза речи. Игроки могут взаимодействовать с NPC голосом, а неигровые персонажи мгновенно отвечают на любые запросы. Подобное живое общение ощутимо усиливает эффект погружения.

Финальный штрих — инструмент NVIDIA Omniverse Audio2Face. Он автоматически синхронизирует лицевую анимацию персонажей с их речью. Audio2Face поддерживает интеграцию с Unreal Engine 5. Поэтому разработчики могут в реальном времени анимировать персонажей, созданных в редакторе MetaHuman. Это делает процесс создания реалистичных NPC доступным даже небольшим студиям.

NVIDIA Omniverse Audio2Face, создание лицевой анимации
NVIDIA Omniverse Audio2Face, создание лицевой анимации

Комплекс инструментов NeMo, Riva и Audio2Face уже сегодня позволяет создавать персонажей, которые не просто выполняют свою базовую функцию, но и выглядят как полноценные личности. Технологии открывают новые возможности для игр с глубоко проработанными и эмоционально насыщенными мирами. В них NPC становятся неотъемлемой частью истории, а их взаимодействие с игроками — естественным и увлекательным.

Платформа Convai — ещё один инструмент для создания NPC на основе нейронных сетей. Например, в одной из демонстраций персонаж по имени Джон обсуждает с игроком тему скейтбординга и живо реагирует на любые запросы. Его можно попросить приготовить еду или выключить свет. NPC понимает человеческую речь и охотно выполняет просьбы.

NPC Джон
NPC Джон

В другой демонстрации с использованием Convai два NPC взаимодействуют друг с другом. Они ведут осмысленные беседы и адаптируются к окружению. Потенциально интересная система для оживления игровых миров. Но разработчики уточнили, что персонажи работали на основе промтов и без человеческого вмешательства ничего бы не вышло. Пока инструмент несовершенен и его приходится корректировать промпт-инженерам.

Беседа двух NPC под управлением ИИ
Беседа двух NPC под управлением ИИ

NVIDIA и Digital Human Tech официально подтвердили, что работают над созданием искусственного интеллекта для крупного ААА-проекта. Им стала Mecha BREAK — многопользовательская игра про сражения больших человекоподобных роботов. Это первый в истории коммерческий игровой проект, где игроки смогут общаться с неигровыми персонажами в режиме реального времени с помощью микрофона. Технологию ACE также можно будет опробовать в игре inZOI — «убийце Sims» от корейских разработчиков.

Mecha BREAK
Mecha BREAK

Появление технологии ACE в столь масштабных проектах уже вызвало бурное обсуждение в игровом сообществе. Есть опасения, что внедрение нейронных сетей может негативно сказаться на требованиях к железу. Большинству нейронок нужно много оперативной памяти и процессорной мощности. Это может стать препятствием в дальнейшем развитии и распространении подобных технологий. Особенно учитывая ограниченность ресурсов в игровых консолях.

Модификация игр

Некоторые моддеры активно интегрируют в любимые игры новые механики и паттерны поведения неигровых персонажей. Одной из таких модификаций стала Responsive NPCs от MistaChedda, которая существенно оживляет мир Cyberpunk 2077.

Мод добавляет системы, которые позволяют NPC реагировать на определённые поступки, внешний вид и манеру поведения игрока. Например, если вы гоняете на автомобиле по тротуарам, пешеходы начнут вас опасаться и обходить стороной. Также вы можете привлечь внимание полиции своим внешним видом, если будете в одежде группировки. Впрочем, бандиты реагируют и на форму полицейских.

Cyberpunk 2077, полицейская форма Найт-сити, на которую реагируют члены группировок
Cyberpunk 2077, полицейская форма Найт-сити, на которую реагируют члены группировок

Важным элементом мода является реакция NPC на оружие. Если игрок держит в руках крупнокалиберную пушку или одет в военную форму, он мгновенно привлекает внимание окружающих. NPC обращают внимание и на протагониста без одежды. Реакции варьируются от откровенного недоумения до агрессии.

Cyberpunk 2077 задержание преступника
Cyberpunk 2077 задержание преступника

Другой пример ИИ-мода — Sentient Streets для GTA V. Он добавляет в игру более 30 разных моделей искусственного интеллекта. Игрок может подойти к любому NPC, привлечь его внимание, а затем вести голосовой диалог через микрофон. Неигровые персонажи отвечают на ваши вопросы и поддерживают диалог. Каждый NPC в этом сюжетном моде обладает индивидуальностью и характером. Например, полицейский может быть дружелюбным, тренер с пляжа — строгим, а работник автомастерской — кокетливым.

Разговор с недобросовестным полицейским в Sentient Streets
Разговор с недобросовестным полицейским в Sentient Streets

Мод создан на основе технологии Inworld AI. Беседы с «неписями» действительно ощущаются естественными и правдоподобными. Подобные моды наглядно демонстрируют, что даже команда из нескольких человек способна перевернуть восприятие NPC с ног на голову. Граница между неигровыми персонажами и реальными собеседниками начинает постепенно размываться. Вот только жаль, что юристы Take-Two нововведений не оценили и приказали разработчиков свернуть проект.

Sentient Streets, общение с прохожим
Sentient Streets, общение с прохожим

Минусы ИИ в поведении NPC

У игроков и разработчиков возникают вполне оправданные вопросы. Как NPC под управлением ИИ может менять сюжет? Как его сгенерированные реплики будут влиять на дальнейшее поведение игрока?

На данный момент нейронные сети несовершенны. И в теории вы можете часами общаться с NPC, но диалоги ни к чему не приведут. В итоге результат может оказаться даже хуже, чем в случае с традиционными NPC с их ограниченными возможностями и заранее прописанными ветками диалогов. По крайней мере, они не тратят время игрока и не уводят его от основного сюжета игры. Представьте себе, как будет выглядеть популярная визуальная новелла, если лето и правда станет бесконечным.

Бесконечное лето (2013)
Бесконечное лето (2013)

Если в дорогих технических демонстрациях всё выглядит довольно неплохо, то на практике не всегда получается так же. Некоторые игроки жалуются на неправдоподобные диалоги с NPC под управлением нейронных сетей. ИИ генерирует тему, исходя из промта или запроса игрока. А традиционным неигровым персонажам сценаристы прописывают диалоги так, чтобы максимально раскрыть сюжет игры и соответствовать её атмосфере.

Разработчики понимают эту проблему и пока не отдают всю власть ИИ. Представители издательства Ubisoft признались, что используют ИИ в связке с реальными авторами. Нарративный директор Виржини Моссер рассказала, что при написании диалогов «привыкла создавать предысторию персонажа, прописывать его надежды и мечты, а также опыт, который сформировал его личность».

Star Wars: Knights of The Old Republic, сценаристы написали для игры более 200 000 строк диалогов
Star Wars: Knights of The Old Republic, сценаристы написали для игры более 200 000 строк диалогов

Кроме очевидных глобальных недостатков есть и более специфические проблемы. Например, если доверить образ главного злодея нейронной сети, вряд ли он будет настолько же ярким и запоминающимся, как тот же Ваас из Far Cry 3. Что делать разработчикам? Самостоятельно прописывать главных и второстепенных персонажей? И лишь эпизодические роли отдавать ИИ?

Ваас Монтенегро — главный злодей и самый запоминающийся персонаж игры Far Cry 3
Ваас Монтенегро — главный злодей и самый запоминающийся персонаж игры Far Cry 3

Или вспомним отношения Кратоса и Атрея из God of War: Ragnarök. Авторы игры проделали колоссальную работу над сценарием и диалогами, а также великолепно раскрыли тему отношений отцов и детей. Теперь представьте ситуацию, что за диалоги в игре отвечал бы искусственный интеллект. С большой вероятностью на выходе мы получили бы что-то несуразное.

God of War: Ragnarök (2022)
God of War: Ragnarök (2022)

Несмотря на впечатляющее развитие нейронных сетей в последние годы, создание динамических NPC по-прежнему остаётся сложной задачей. По словам Павла Саско из CD Projekt Red, ИИ пока не может достичь той глубины, которую обеспечивают традиционные сценаристы. Текущие технологии всё ещё слишком далеки от того, чтобы создавать реалистичных NPC без участия людей. Можно лишь гадать, сколько лет нас отделяют от перехода индустрии на следующий уровень.

Чего ожидать от ИИ в играх

NPC под управлением нейронных сетей уже сегодня могут вести себя, как почти настоящие люди: адаптироваться к поведению игрока и запоминать взаимодействия с ним. Однако пока технология настолько сырая и неадаптированная для массового рынка. Во многом сложность интеграции нейронных сетей в видеоигры упирается в технические ограничения в виде недостатка оперативной памяти для хранения обученных моделей.

Авторы игр прибегают к разным способам написания диалогов и создания NPC. ИИ-технологии, безусловно, открывают перед ними новые возможности. Поэтому не исключено, что в ближайшие годы мы увидим NPC неотличимых от персонажей, которых раньше создавали профессиональные сценаристы. Но когда именно это случится — вопрос открытый. Важно лишь то, что искусственный интеллект постепенно начинает менять подход к созданию игр.

Если вам понравился материал, подписывайтесь на наш Telegram-канал. Там вы найдёте много интересного о видеоиграх. Например, топ самого необычного оружия в шутерах или историю про самые скандальные хоррор-игры.

2
1
15 комментариев