Big Data в кино: Netflix, Кевин Спейси и генерация сценариев

Как алгоритмы придумывают кино

Оригинал видео. Далее текстовая расшифровка. Я не автор видео.

Кевин Спейси. Вы уже, наверно, забыли кто это такой после всех историй с домогательствами (прим.: на DTF, конечно, не забудут). Но не удивительно - если даже Ридли Скотт тратит 10 миллионов долларов на то, чтобы стереть его из коллективной памяти. Кевину, между тем, всё ещё поступают предложение сняться в кино. Правда, всё больше где нибудь в Европе, и даже в России, как ни странно. Но для него самого важнее вернуть расположение родной американской публики. Именно к ней он обратился под рождество из собственной кухни в образе Фрэнка Андервуда из "Карточного домика".

Казалось бы, самое время напомнить о своих оскароносных ролях из 90-х: "The Usual Suspects", "American Beauty". Хотя понятно, что в отличие от них "House of Cards" всё ещё на слуху. Но вышло иронично, потому что для такого максимально личного и человечного контакта со зрителем был выбран образ, который обязан своим появлением компьютерному алгоритму.

В оригинале "House of Cards" - это 4 английских телефильма, почти 30-летней давности, о том как после ухода Маргарет Тэтчер разворачивается борьба за пост премьер-министра Великобритании. Идея адаптировать проект для Америки витала в воздухе давно, но даже участие таких мастодонтов как Кевин Спейси и Дэвид Финчер не заинтересовало ни HBO, ни AMC, ни Showtime. Никто не рискнул выделить хотя бы пару миллионов долларов на то, чтобы снять пилотную серию. Зато нашлась компания готовая выложить сразу 100 миллионов и подписать контракт на два сезона. Вопрос: что такого знали в Netflix, чего не знали другие?

Карточный домик (House of Cards, 1990)
Карточный домик (House of Cards, 1990)

Немногие в курсе, что Netflix был основан еще в 1997 году - за 10 лет до запуска своего видеостриминга. Тогда они занимались тем, что доставляли по почте DVD, среди которых были диски с одним неприметным британским сериалом "House of Cards". Узнав о готовящемся перезапуске проекта, в компании подняли архивы и посмотрели кто в свое время заказывал конкретно этот диск, а заодно что эти люди смотрят сейчас уже в онлайне. Оказалось, что в большинстве своем, они любят фильмы с Кевином Спейси, а еще целиком посмотрели "Социальную сеть", которую снял Дэвид Финчер. Более того, эта цепочка работала и в обратном направлении. По статистике сервиса поклонников Финчера интересовал Кевин Спейси и сюжеты с политической интригой. Короче, джекпот!

Но на этом Netflix не остановился. Было решено использовать Big Data в раскрутке проекта. Поэтому вместо одного рекламного трейлера было смонтировано сразу десять. Основной с Кевином Спейси, еще один специально для женщин - там где больше кадров с актрисами, а прошаренным киношникам - с акцентом на фирменной режиссуре Финчера и т.д. По итогам первого сезона "Карточный домик" стал самым популярным шоу сервиса и первым чисто сетевым сериалом, который удостоился самых престижных номинаций Эмми. Этот случай вошел в историю как первый прецедент, когда Big Data использовалась не для рекомендательного алгоритма, а для высокого бюджетного креативного решения.

Карточный домик (House of Cards, 2013-2018)
Карточный домик (House of Cards, 2013-2018)

Сегодня "таргетинг" от Netflix один из самых мощных в интернете. Сервис отслеживает не только, что вы искали, смотрели, когда, где и на каком устройстве, но и какие фрагменты перематывали вперед, а какие назад, чтобы пересмотреть. Предположительно, особо популярный контент разбирается детально - какая была громкость, цветовая палитра и даже композиция кадра. Самые удачные скриншоты в итоге оказываются на превью картинках, причем у всех они разные вплоть до того, что чернокожим пользователям могут показать персонажа афроамериканца, даже если в фильме он появляется всего на пару минут.

Помимо тотальной персонализации видео ленты, Big Data Netflix порой формируют довольно странные подборки. Например, 10 фильмов с якобы с самыми страшными концовками:

  • Лихорадка (Cabin Fever, 2016, RT: 0%, IMDB: 3.7)
  • Парк резни (Carnage Park, 2016, RT: 61%, IMDB: 4.9)
  • Варварская Мексика (Mexico Barbaro, 2014, RT: 60%, IMDB: 4.9)
  • Пираньи (Piranha, 2010, RT: 74%, IMDB: 5.5)
  • Сырое (Raw, 2010, RT: 90%, IMDB: 7.0)
  • Зубы (Teeth, 2007, RT: 80%, IMDB: 5.4)
  • Заклятие (The Conjuring, 2013, RT: 86%, IMDB: 7.5)
  • Человеческая многоножка 2 (The Human Centipede 2: Full Sequence, 2011, RT: 30%, IMDB: 3.8)
  • Пустота (The Void, 2016, RT: 75%, IMDB: 5.8)
  • Иерусалим (Jeruzalem, 2015, RT: 59%, IMDB: 4.7)

Зрители почему-то в массовом порядке их выключают - надо полагать от омерзения.

Этот холодный математический расчет Big Data находит положительный отклик у людей креативных. Так Кэри Фукунага - автор ремейка "Оно", режиссёр первого сезона "Настоящего детектива" и будущего юбилейного 25-ого Джеймса Бонда, человек который славится своей бескомпромиссностью, пошел навстречу руководству Netflix, когда те попросили исключить из его сериала "Maniac" всего одну серию, где была необычная сюжетная структура. Алгоритм показывал, что на этом эпизоде часть аудитории попросту отвалится и не досмотрит шоу до финала. Представьте, если бы с таким предложением выступил какой-нибудь телевизионный начальник, ни черта не понимающий в режиссуре. Фукунага просто бы ушел, как вообщем-то и случилось на съёмках фильма "Оно".

Маньяк (Maniac, 2018)
Маньяк (Maniac, 2018)

А что если прахом пойдет многомиллионный бюджет какого-нибудь голливудского блокбастера, просто потому что студия неправильно оценила запросы аудитории. История знает такие прецеденты - "Остров головорезов", "Джон Картер", "Водный мир". Неудивительно, что большие киношные студии тоже активно изучают Big Data и говорят, что их интерес к этой области всколыхнул один хорошо известный фильм, основанный реальной истории.

- Менеджерам бейсбольных клубов лишь бы скупить игроков, но покупать надо не бейсболистов, а победы. По моим подсчетам нам нужно выиграть минимум 99 игр, чтобы выйти в плей-офф.

- А это что?

- Это мой код для годовых прогнозов. Он использует наши разведданные, чтобы оценивать игроков. Таким образом мы приводим все к единому показателю. Благодаря этой статистике мы найдем ценных игроков, которых все недооценивают.

Диалог персонажей фильма "Человек, который изменил все"
Человек, который изменил все (Moneyball, 2011)
Человек, который изменил все (Moneyball, 2011)

Если какой-то "data-scientist" cмог собрать практически чемпионскую команду по бейсболу из далеко не самых высокооплачиваемых, но удачно дополняющих друг друга игроков, значит ли это, что можно снять блокбастер за копейки с никому не известными актерами?

Нет, едва ли. Но можно проанализировать бокс-офис за последние десятилетия, а нейросети очертят закономерности и смогут предсказывать сборы фильма еще до его съемок по одному лишь сценарию. Как раз этим занимается стартап ScriptBook и просит за такую услугу 5000 долларов. Они утверждают, что в своё время точно угадали сборы фильма "Пассажиры". Правда умалчивают что серьёзно промахнулись с "Ла-Ла Ленд" - тот собрал почти вдвое больше прогноза. В перспективе чем больше будет собираться данных, тем и точнее станет такой анализ. Но уже сейчас алгоритм ScriptBook с большой вероятностью распознаёт заведомые провалы. Из 32 убыточных фильмов, снятых в 2015 и 2016 годах, алгоритм, прочитав один только сценарий, не дал зеленый свет двадцати двум - уже неплохо.

Сейчас стартапов, которые занимаются примерно тем же, наберется уже с десяток. Некоторые из них особо амбициозные. Они пытаются нащупать закономерности вообще по всем поп-культурным предпочтением людей и даже выходят за их рамки. Например, если человек любит группу "Pearl Jam", канадский фильм "Куб" и игры серии "Bioshock", значит у него белая кошка и значит именно такого цвета кошек надо вставлять в умный рекламный баннер с кошачьим кормом.

Рассказ был бы неполным, если обойти стороной довольно нашумевшую в своё время историю о том, как на компьютер повесили производство кинопроекта. Больше всего в этом деле преуспели два киноэнтузиаста - это британец Оскар Шарп и американец Росс Гудвин. Они не преследовали сверхприбыль, их интересовало другое - если компьютер напишет совершенно случайный, лишенный человеческой логики, бессвязный сценарий и его поставят настоящие актеры на съемочной площадке, появятся ли в нём хоть какой-то смысл с рациональным зерном или же всё так и останется полным бредом. Причем сначала они пробовали получать компьютерный текст совершенно удивительным образом - они собрали громоздкую камеру, которая печатала текстовое описание того, что попадало в её объектив видоискателя. Иногда получалось очень забавно:

Аналогично, у мужчины длинные волосы. В остальном у него снежный человек чем женщина, сразу отправился в путешествие по Европе, раньше оно могло бояться обязательств.

Но в итоге для этих целей был задействован более привычный предикативный алгоритм. Привычный потому что сейчас так работают многие программные клавиатуры, предугадывающие следующее слово, которое вы собираетесь набрать. Только здесь предугадывались не слова, а каждая буква, что в теории позволяло повысить оригинальность создаваемого текста. Во-вторых, алгоритм был научен не на массиве личной переписки, а на киношных сценариях, где текст поделен на реплики персонажей и их действия. В итоге родилась 9-минутная короткометражка, которая получила название "Sunspring". В ней даже снялся Томас Миддлдитч из сериала "Silicon Valley" (Кремниевая долина). На слух фильм, конечно, тотальный бред.

Самое смешное, что на пресс-конференции после показа вопросы решили задавать непосредственно алгоритму. В ответе на один из них алгоритм внезапно представился именем Бенджамин, что многих, видимо, напугало.

Следующий эксперимент был с Дэвидом Хассельхоффом, когда его роль целиком была прописана компьютером, но при этом вставлена в обычный авторский сценарий. Получилась сомнительная мешанина.

Последний пример датируется прошлым годом, когда алгоритму скормили два старых черно-белых фильма, потому что на них истёк копирайт. Вдобавок предварительно отсняли на зелёнке мимику актеров, чтобы алгоритм подставлял их в лица и генерировал реплики с помощью голосового синтезатора.

Пока что получается какой-то лютый треш. Но если пофантазировать, то несложно представить как через пару лет состоятельные студии смогут убирать усы Супермену или омолаживать Принцессу Лею, не затрачивая на это десятки миллионов долларов и не привлекая студии, работающие со спецэффектами, а свои силами, с помощью нейросетей.

5353
19 комментариев

У Фёдора топ контент

11
Ответить

А это тот чувак из Games-tv или как оно там теперь называется. Хреновая контора со скучными ведущими, особенно смешила их попытка монетизировать свои видео

6
Ответить

Комментарий недоступен

2
Ответить

Да, он. Сейчас он вроде не там. Вообще, оттуда поуходили многие. Например, там работал Паша Болотский.

1
Ответить

По 'Maniac' чувствуется, что алгоритмы создавали/утверждали сеттинг, персонажей и сюжетные ходы. Поэтому он не оправдал хайпа, показался вторичным и, в итоге, не взлетел.

4
Ответить

Нейросети придумывающие сценарии. Математический анализ лучших кадров, палитры и прочего. Алгоритм, который сможет создавать кассовые фильмы. Мне скорее грустно, чем радостно.
Остановите планету, я сойду...

3
Ответить

Такими темпами мы можем дожить до момента, когда фильмы будут делать нейросети - придумывать сценарии, выбирать актёров и указывать ракурсы съёмки.
Естественно, это до того, как её научат генерировать картинку полностью.
Учитывая как много сейчас контента и потока информации, у нас не будет стоять выбора потратить наше время на сюжет, снятый человеком (может оказаться неинтересным), или бездушным алгоритмом, знающим нас лучше нас самих.

1
Ответить