Лингвистический анализ cRPG: бумерские vs. зумерские

На сравнение, меня сподвигли позитивные отзывы о Tyranny, которая лично мне казалась самой слабой с точки зрения текста. Чтобы подтвердить или опровергнуть свою догадку, я попытался придумать объективную методику, по которой можно сравнить тексты разных игр: (уникальные корни / общее количество корней). А вырвав тексты из игр, я увлекся и сравнил в них разного рода диалоговые проверки.

Словарный запас

Для начала, я написал тулзы, с помощью которых вырвал диалоговые строчки NPC из следующих игр: BG1, BG2, IWD1, IWD2, PST, POE1, Numenera и Tyranny. Строки игрока я намерено проигнорировал, т.к. игрок чаще всего задает вопрос или сухо сообщает информацию. Рассказчиками выступают именно NPC.

Далее, я лемматизировал слова, т.е. привел слова к их базовой форме. Слова "бежит", "бегут", "бежал" и "бег" имеют разные формы, но все они являются производными от леммы "бежать".

Пример фразы: "Волшебники творили заклинания, драконы спали, а рыцари сражались за свою землю."

После лемматизации: "Волшебник творить заклинание, дракон спать, а рыцарь сражаться за свой земля."

Альтернативой лемматизации был стемминг, т.е. извлечения корня. Для этого есть два алгоритма - Porter stemming и Snowball stemming, но они все работают неидеально. Леммы показались мне более перспективными.

Т.к. игры разной длины, я решил обрезать сравнение на определенном пороге, который я выбрал произвольно - это порог в 450 тыс. слов.

Обратите внимание, что ось Y экспоненциальна. Я считаю это честным для визуализации, т.к. даже замена одного слова из десяти на более чёткий и подходящий вариант может значительно улучшить качество текста. И именно на 10% Тирания и отстаёт от остальных игр. После отметки в 150 тыс. она отваливается и больше никогда не нагоняет своих конкурентов.

В Тирании - самый примитивный словарный запас<br />
В Тирании - самый примитивный словарный запас

Самые часто используемые слова

Второе сравнение, которое само напрашивалось, это взглянуть на самые часто употребляемые слова в играх.

Убраны все леммы до 4 символов в длину (есть небольшой баг с бг1, туда просочилось слово go, прошу не обращать внимание).
Убраны все леммы до 4 символов в длину (есть небольшой баг с бг1, туда просочилось слово go, прошу не обращать внимание).

Красным я выделил слова, которые являются сленговыми, именами, названиями, т.е. спецификой самого произведения.

Сразу можно отметить, что Planescape Torment хоть и богат сленгом, но сленг там не используется чрезмерно и не мозолит глаза, не вставляется в каждый второй диалог. Авторы соблюдают приличия. Разве что cutter попал в топ. А ведь жаргон там по-настоящему создавал очаровательную атмосферу. Дэвид Зеб Кук вдохновлялся криминальным жаргоном Англии 1600-1800-ых годов для создания сленга Сиджила.

Чрезмерным использованием специфической лексики не страдают и остальные игры. В Балдурсе лишь часто упоминается антагонист Саревок, в IWD1 местечко Кулдахар, и даже Пилларсы, со всеми их "энгвитанцами", "пусторожденными" и "фампирами", выдерживают проверку здравых лексических пропорций.

Тирания же тест полностью проваливает. Полностью. Возглавляет хит-парад fatebinder - самое часто используемое слово в игре. Я не знаю, как его перевели на русский, прошу прощения. Так в игре называют протагониста. Они просто взяли два английских слова и слепили из него одно сложенное, что английский язык разрешает, но чрезмерное использование этого приёма - верный признак школьного фентези.

Чуть ли не в каждом предложении, у нас фейтбайндер через фейтбайндер. В начале игры к нам подбегает персонаж и восклицает:

Слава [Кайросу], вы пришли! Нас предупреждали о приближающемся [фейтбайндере]! [Высеченный Пепел] и [Голоса Нерата] не могут определиться, как нам разбить [клятвопреступников]. Ты принёс приказ из [Тунона], чтобы помочь им разобраться?

Примерный пересказ первого же разговора в игре

Видимо осознавая сюрреализм написанного, они даже ввели глоссарий. Можно кликать на [слова], чтобы всплывала подсказка с объяснением.

Здесь авторы не смогли найти баланс между желанием как можно быстрее познакомить с миром, и сделать это гладко. Стивен Кинг в своей книге "Как писать книги" даёт пример того, что Тирания сотворила в масштабах всей игры.

"Привет, бывшая жена," сказал Том, когда Дорис вошла в комнату.

Для истории может быть важным то, что Том и Дорис разведены. Но должны существовать и более грациозные способы передать эту мысль. В текущем виде, она так же грациозна, как убийство топором.

"Привет, Дорис," сказал Том. Его голос звучал почти естественно, по крайней мере ему так казалось, но его пальцы невольно скользнули к тому месту, где было обручальное кольцо еще шесть месяцев назад.

Пулитцер мы с этим не выиграем, и вышло подлиннее чем "Привет, бывшая жена", но с некоторыми вещами спешить просто нельзя.

В заключение данного сравнения, Тирания безусловно является самой слабой с текстово-стилистической точки зрения. По игре плачут, просто рыдают редакторы. По Пилларс от тех же Обсидианов они плачут в той же мере, но по другим причинам, которые я раскрыл в позавчерашнем лонге. Там игра страдает от пурпурной прозы.

Длина текста

До выхода Torment: Tides of Numenera, Брайан Фарго любил твитнуть, что игра перевалила за 1.2 миллиона слов и обошла саму библию. Студия InXile кичилась тем, что игра длинная, ОЧЕНЬ длинная. Ведь они пообещали сделать духовного наследника Planescape Torment, а в нём, как известно "много текста".

Но потом Torment: Tides of Numenera вышла и внезапно провалилась. Что же пошло не так? Об этом мы можем поговорить в другой раз, но как минимум повлияло то, что Planescape Torment, на который они оглядывались, вопреки расхожему мнению, вовсе не является длинным.

Лингвистический анализ cRPG: бумерские vs. зумерские

Если сравнивать по количеству слов от NPC, второй "Тормент" вышел в два раза длиннее первого. Пилларсы, которые обещали быть духовным наследником первой "быгни", оказались в два раза длиннее её. Тирания в полтора раза длиннее Пилларсов. Современные RPG от Obsidian и InXile страдают от нескончаемых стен текста и отсутствия редакторов как таковых.

Почему книжные авторы часто благодарят своих редакторов в предисловиях, часто рассказывают с примерами как книга пострадала бы без редакторского сопровождения и какую чушь автор писал до того как редактор помог исправить те или иные аспекты, а в RPG у Обсидианов и Инекзайлов просто нет понятия редактуры? Очень уж они самоуверенные и самовлюбленные.

В чём мы крутые? [...] Чем мы славимся? [...] Тем, как мы пишем.

Фергус Укхарт, глава Obsidian в интервью PCGamer

Далее в статье, я сравниваю старые РПГ на движке Infinity Engine друг с другом в реактивности и вариативности, и больше не трогаю новые игры, т.к. они мне не нравятся и мало интересуют. Любителям статистики посвящается.

Диалоговые разветвления

Среднее кол-во ответов игрока (когда их 2 или больше, чтобы исключить случаи, когда ответ один - "продолжить")<br />
Среднее кол-во ответов игрока (когда их 2 или больше, чтобы исключить случаи, когда ответ один - "продолжить")

IWD2, за счет малого числа диалогов, сумела предоставить самую большую вариативность диалоговых ответов. За ней следуют PST > IWD1 > BG2 и BG1.

Из длинных игр, лидирует PST.

Проверки статов в диалогах

Лингвистический анализ cRPG: бумерские vs. зумерские

В PST проверки есть, и много. В остальных играх - едва ли.

БГ1 проверяет в основном один стат - "реакцию". В большинстве случаев, это определяет дадут нам квест или нет. А если квест уже дан, то определяет дадут нам золото, или золото + предмет. В редких случаях, НПС может поздороваться с нами иначе, в зависимости от реакции. В общем и целом, можно сказать что вариативности от проверки статов тут просто нет.

БГ2 позаимствовала идею с реакцией от первой части. Если вглядеться в цифры, можно подумать что в сиквеле появились проверки и на другие статы, но это очень обманчивое впечатление. Можно его разобрать на нескольких примерах.

Проверки интеллекта: 26 раз

Дроу: Когда я говорю о пожирателях, Велдрин,... ты понимаешь о ком я говорю?

- [Int > 14] Ты имеешь в виду иллитидов? Да, я их знаю.
- [Int 9-14] Ты имеешь в виду свежевателей разума? Да, я их знаю.
- [Int <9] Ээ.... ты об отиджах?

В этом диалоге у нас целых 3 проверки интеллекта, и кажется это единственный случай "глупой реплики" à la Фоллаут за всю игру.

Контрабандист: Спасибо за помощь в этом... неприятном дельце. Я уверен Эсамон поблагодарил бы тебя, если бы был тут.
- [Int > 14] Эсамон? Погоди, ты имеешь в виду САЭМОНА ХАВАРИАНА?

Лингвистический анализ cRPG: бумерские vs. зумерские

В конце второго Балдурса, в Салданесселларе, за запертыми воротами стоит эльф, которого нужно уговорить, что мы не иллюзия, чтобы он открыл ворота. Выбранный ответ требует 14 интеллекта.

Лингвистический анализ cRPG: бумерские vs. зумерские

Помимо "умного" варианта, у нас еще сотня других, которые не требуют практически ничего. В конечном итоге, даже если ваш чар просто идеальный инвалид со всеми статсами, вам хватит даже 9 харизмы, чтобы уломать его отпереть ворота.

Вилфред в палатке удовольствий в Трейдмите хвастается военными навыками. Если у вашего персонажа есть 15+ интеллекта (почему интеллекта, а не силы?), вы можете его припугнуть и он признается, что всё выдумал и извинится.

Лингвистический анализ cRPG: бумерские vs. зумерские

А если у вас 14 мудрости, можно просто ему не поверить и вам дадут 1,000 опыта и 1,000 золотых, но на этом путешествие в вариативность в этом диалоге кончается.

В разговоре с дроу-нимфоманкой, у нас целых 7 проверок на интеллект, чтобы попытаться выбраться из неловкого положения и сберечь свою девственность от этой озабоченной тёмной эльфийки.

Лингвистический анализ cRPG: бумерские vs. зумерские

Вы можете сходу определить, какие из этих вариантов умные? Я нет.
Первый вариант требует 16+ инты и 12- харизмы.
Второй 16+ инты и 13+ харизмы.
Третий и четвертый 14+ инты и какую-то харизму.
Не знаю, зачем здесь так много проверок. Кажется, кто-то в Биоварах перевозбудился во время написания этого диалога. В конечном итоге, можно без каких либо проверок сообщить, что вы принадлежите другой, и остаться волселом.

В бардовском стронгхолд квесте есть 8 тихих проверок на инту - они влияют на то, какого качества пьесу вы напишите. По-моему это первая вразумительная проверка на стат.

Имеется одна проверка на инту в разговоре с патрулем в Андердарке, и снова можно пройти проверку любым другим статом.

Второе место, где встречается какая-то разумная проверка на инту - в мини-сайдквесте с Викангом. Для него вам потребуется 18+ инты. Мелиссан вылечила его от панических атак, от которых он невольно телепортировался, и в результате он застрял в осажденном городе. Вы можете посоветовать ему воспользоваться свитком Страха, чтобы помочь ему покинуть город.

Оставшиеся две проверки снова не представляют особого интереса.

Цирик (прим. автора - бог лжи): Ты знаешь, кто я такой?
- [Int <13] Кого-то... ты мне напоминаешь...

Гитиаянки: (кхм!) Эй, ты, <RACE><MANWOMAN>! Меня освободили из лимбо с одним условием: я должен найти вора, который украл нашу святыню святых.
- [Int >9] Ты имеешь в виду серебряный меч, что ли?

Игра поднимает философский вопрос: если нужно лишь 9 инты, чтобы пройти проверку, является ли это вообще проверкой?

В следующем примере, вернемся к Балдурсу 1. Для того, чтобы иметь возможность произнести данную реплику, вам понадобится 10 силы. Мало кто данную проверку заметит, т.к. 10 силы есть почти у всех.

Я хочу знать, где ваш лагерь, говори правду! Если мне не понравится правда, я сломаю тебе ногу. Если ты лжешь, я сломаю тебе спину. А теперь задумайся, ты хочешь хромать или ползать?

Жесткий базар для парня с 10 силы...

Обратите также внимание, что в БГ2 есть одна несчастная проверка ловкости за всю игру. В квесте "найти доказательство измены МаеВара", можно сломать шею прямо во время разговора, если иметь 17 ловкости.

Прямо как в PST<br />
Прямо как в PST

Что касается 200+ проверок харизмы в БГ2, в основном они определяют награды за квесты и ничего более. Можно 10 раз пройти игру и даже не узнать о них.

Проверки присутствия NPC в пати

Лингвистический анализ cRPG: бумерские vs. зумерские

БГ2 была первой РПГ, где неписи ожили и начали сами запускать диалог с протагом по собственной инициативе. Также влияет то, сколько их всего в игре. Если бы в игре было два нпс, в разговоре с нпс1 он мог бы сделать проверку на нпс2, и наоборот, и было бы 2 проверки в сумме. А т.к. у нас их 17 и они часто проверяют наличие друг друга, то и количество проверок растет геометрически.

Проверки на класс игрока

Лингвистический анализ cRPG: бумерские vs. зумерские

IWD2 значительно опережает по данному параметру все остальные игры.
Я исключил проверку "не паладин" из IWD2, которых в сумме еще 500 штук, и оставил только проверки "является ли классом".

Проверки на бога

Лингвистический анализ cRPG: бумерские vs. зумерские

Замечу, что IWD1:EE добавляет 41 проверку на Темпуса, которые не вошли в статистику, т.к. я работал с ванильной IWD1. Удивительно, но похоже Beamdog что-то таки улучшила хотя бы в одной из своих "улучшенных изданий".

IWD vs IWD:EE<br />
IWD vs IWD:EE

Проверки на расу

Лингвистический анализ cRPG: бумерские vs. зумерские

Следует учитывать, что 1 проверка не равна 1 реальной ситуации. Так, в БГ2 есть 73 проверки, которые по факту равняются 6 случаям реальных проверок на расу.

Белмин Гергас ненавидит эльфов и пытается нас предупредить об их опасности. Фразы 1, 2 и 3 проверяют нет ли у нас в пати эльфов (3 фразы умноженные на 6 проверок т.к. всего 6 слотов напарников = 18 проверок).

Лингвистический анализ cRPG: бумерские vs. зумерские

Если играть за эльфа и называться Дриззтом, настоящему Дриззту может это не понравиться.

Эй, ты! Наконец-то мы встретились... Меня достало до печёнок слышать о твоих похождениях, в которых ты притворяешься мной! Хватит пользоваться моей репутацией... моё имя принадлежит мне!!

Можно успокоить психа Якмана, имея 15+ харизмы и будучи эльфом (либо можно его просто похилить).

При выходе из андердарка, эльфы обратят внимание на то, что вы - эльф. (десяток проверок на эльф и не эльф)

Дуэргар в "Медной Короне" более приветливо здоровается, если вы - дварф.

Халфлинги, дварфы и гномы получат эскортницу другой расы в "Медной Короне". (все проверки на гномов и халфлингов в этой игре находятся в этом диалоге)

Проверки на мировоззрение

БГ1 как всегда монорельсовая игра, а IWD2 делает больше всех проверки на злых персонажей.
БГ1 как всегда монорельсовая игра, а IWD2 делает больше всех проверки на злых персонажей.

Проверки на пол

Лингвистический анализ cRPG: бумерские vs. зумерские

Сумма проверок

Лингвистический анализ cRPG: бумерские vs. зумерские

Конечно же, по реактивности диалогов в целом, победитель с большим отрывом - Planescape: Torment. Это совершенно не стало удивлением, но это стоило зафиксировать объективно.

P.S.

В комментах к моему позавчерашнему лонгу, один из рандомных пользователей ДТФ рекомендовал мне не поднимать лингвистические темы.

Лингвистический анализ cRPG: бумерские vs. зумерские

Комментарий побудил меня дописать уже несколько лет вынашиваемую статью. Все бы комментарии так мотивировали, уже бы давно на луне жили. Спасибо Дмитрий.

507507
243 комментария
Комментарий удалён модератором

Дтф благодарный

12
Ответить

Выводы от автора действительно субъективные и не всегда вытекают из данных.

НО сырые данные - очень крутые и работа проделана.

Так что, как лбые статьи в интернет - стараемся вычленить объективные факты и игнорируем мнение автора.

20
Ответить

Комментарий недоступен

79
Ответить

Полностью согласен. Реально интересный текст а не простыня на 10 тысяч слов о том как какой то школьник поиграл в ведьмака 3.

23
Ответить

что тут такого, что аш на 3 головы выше других интересных лонгов по играм? отдельный вопрос какую ценность представляет этот анализ, но тут я уже судить даже не берусь, ибо не шарю

17
Ответить

А ты усердный. Раз пять лет сидел на пдф абсолютно без интереса и чекал лонги, в ожидании этого 👍

5
Ответить