Аниме-анализ MyAnimeList.Net

Ну, короче, есть собранный чилийским коллегой датасет, содержащий 17562 анимы от начала времён с пользовательскими голосами и прочей информацией MyAnimeList.Net. Я его рассмотрел и сделал вам много картинок:

распределение аниме по числу голосов и среднему рейтингу<br />
распределение аниме по числу голосов и среднему рейтингу

Пока берутся все аниме что есть вне зависимости от жанра и вероисповедания. Отмечаем мастодонтов с большим чем 1-м миллионом голосов, они будут в табличке ниже. Средний рейтинг — шестёрка, хотя шкала десятибальная, как и школьные оценки — её можно было бы начать с двойки. Короче, ниже семёрки опускаться уже опасно, плохой средний рейтинг ставится неохотно. Дальше смотрим на табличку с топами по числу голосов и по среднему рейтингу (название на английском в соответсвие с исходным датасетом):

баз комментариев<br />
баз комментариев

Смотрим и удивляемся, сколько вообще всего делают за год и как оно копится:

от 17-ти тысяч осталось 12-ть тысяч, потому что у прочих не очень хорошо с доступной информацией в плане жанров, года выпуска, названия и прочего.
от 17-ти тысяч осталось 12-ть тысяч, потому что у прочих не очень хорошо с доступной информацией в плане жанров, года выпуска, названия и прочего.

Далее смотрим какой рейтинг у разных групп аниме, составленные по первоисточнику/возрастному рейтингу/жанру/типу, и какую долю какая группа занимает от общего числа (жёлтая линия - среднее, коробочка занимает 50% от всего числа, оставшиеся 50% распределения покрываются границами ошибки, но есть исключения, показанные зелёными ромбиками):

делайте аниме на основе лайт-новел, аниматоры будущего! они у вас лучше получатся и не вздумайте сами что-нибудь сочинять, это дело не ваше, с высокой вероятностью<br />
делайте аниме на основе лайт-новел, аниматоры будущего! они у вас лучше получатся и не вздумайте сами что-нибудь сочинять, это дело не ваше, с высокой вероятностью
а я всегда знал, что вы любите насилие больше, чем эротику<br />
а я всегда знал, что вы любите насилие больше, чем эротику
всё ещё смотрите телевизор? - правильно, лучшее аниме выходит именно там, а ещё его заметно больше <br />
всё ещё смотрите телевизор? - правильно, лучшее аниме выходит именно там, а ещё его заметно больше
Деменцию так просто не сделаешь, но эксперименты рей существуют<br />
Деменцию так просто не сделаешь, но эксперименты рей существуют

Теперь посмотрим, как менялись предпочтения с течением времени, отметим, так сказать, упадак мехи и сай-фая, и поворот к школьной жизни и обыденности. Начнём, словно образованные люди, с 1958-го года:

нельзя не отметить, как в процентном соотношении разврат хентая достиг своего пика в 2000-м и стабильно идёт на спад с тех пор. Не это ли есть отражение неких более глубинных процессов в современном обществе? кто знает..<br />
нельзя не отметить, как в процентном соотношении разврат хентая достиг своего пика в 2000-м и стабильно идёт на спад с тех пор. Не это ли есть отражение неких более глубинных процессов в современном обществе? кто знает..
По книгам аниме не снимешь - тоже восточная мудрость. ONA выдавливает OVA, а телевизор вечен. Кино тоже как-то ушло на спад.<br />
По книгам аниме не снимешь - тоже восточная мудрость. ONA выдавливает OVA, а телевизор вечен. Кино тоже как-то ушло на спад.

Корреляции, они есть у меня. Все не буду показывать, но вот самую большую корреляцию между жанрами аниме загружу. Чем краснее клеточка на пересечении жанра, тем большее число аниме вышло с такими жанрами:

<br />

На самом деле таблица просто генератор идей для комбинации новых жанров аниме: вампиры против самураев в космосе, полицейские-юри-спорсмены, гонки на машинах в фэнтези-школе, пародия на триллер в армии, хоррор-гарем с деменцией героя и далее.
Теперь немного про странные фичи:

распределение числа аниме по длительности эпизодов и числу серий (если больше одной) <br />
распределение числа аниме по длительности эпизодов и числу серий (если больше одной)
распределение по длине названия в числе слов и числе букв<br />
распределение по длине названия в числе слов и числе букв

Топ-3 по длине названия:

ну да, всё из-за уточнений после двоеточия<br />
ну да, всё из-за уточнений после двоеточия

Самые короткие названия: «9”, “2”, “X”, “K”, “CP”, “Fly”, “Bug”, “For”, “Dot”, “She», много их.

Далее смотрим на студии:

красная линия S = 4.1 + 0.018 * число работ, ниже которой по рейтингу студий нет
красная линия S = 4.1 + 0.018 * число работ, ниже которой по рейтингу студий нет

Тут можно вывести закон банкротства студий — минимальный средний рейтинг всех выпушенных работ для существования должен быть выше S = 4.1 + 0.018 * число работ.
А ещё ведь надо сказать, что обычно аниме делают более чем одна студия, одна из которых с большой вероятностью существует менее года:

Аниме-анализ MyAnimeList.Net

Что-то похождее можно сказать про продюсеров и дистрибьютеров, но надо ли? Лучше рассмотрим рейтинг аниме в зависимости от пятилетки года выхода:

аниме выходит всё лучше и больше, надо сказать<br />
аниме выходит всё лучше и больше, надо сказать

и от месяца выхода (первой серии):

довольно равномерненько...<br />
довольно равномерненько...

а в каких пропорциях между годами и месяцами распределено внимание зрителей:

короче, есть ровно четыре месяца в году, когда анимешники нерестятца<br />
короче, есть ровно четыре месяца в году, когда анимешники нерестятца

В заключении рассмотрим пару тенденций для самых высокорейтинговых аниме в зависимости от их топовости:

довольно стабильненько...<br />
довольно стабильненько...

Текст мой, код авторский, будет выложет вот тут :

Сейчас можно посмотреть ещё вот здесь:

Оригинальный датасет:

Если есть предложения по другим графикам, то излагайте, может быть, добавлю!

#аниме #anime #data #графики #аналитика #анализ #python

172172
56 комментариев

А зачем анализировать говно? 

Ответить

Тебя никто не анализирует, успокойся.

61
Ответить

Если отбросить "онимешные чувства" - то т.к. это приносит хорошие деньги, т.е. это кладезь информации для студий.

1
Ответить

А кто может рассказть почему даже по очень популярным манге-аниме так неохотно пилят 12+ эпизодники. 40 эпизодов вообще краснокнижье сейчас.

10
Ответить

Просто 95% аниме это не самостоятельное произведение, а реклама манги/ранобэ (на которых и поднимают бабла). Львиная часть бабла с аниме идёт японскому комитету какой-то хуйни, который повязан с телеканалами по которым аниме и транслируют.

15
Ответить

А кто может рассказть почему даже по очень популярным манге-аниме так неохотно пилят 12+ эпизодники. 40 эпизодов вообще краснокнижье сейчас.

Википедия может.
"Как правило, длительность одной серии составляет 23—25 минут, что вместе с рекламой образует стандартный блок в программе вещания — полчаса. Данный формат был разработан в 1960-е годы Осаму Тэдзукой.

Иногда встречаются серии по 12 минут — для показа сразу двух серий блоком. Ещё реже можно встретить пяти- и трёхминутные серии.

Продолжительность сериала обычно кратна сезону, состоящему из 12—13 серий, поскольку в длительность календарного сезона укладывается 12—13 недель, а аниме обычно транслируются по одной серии в неделю.

Наиболее распространены сериалы из 24—26 серий, хотя существуют как значительно более длинные, за сотню серий, так и короткие.

Последние встречаются реже, чем 26-серийные, поэтому часто под «сезоном» понимают именно полугодичные наборы серий.

На продолжительность сериала может влиять его популярность."

6
Ответить

Дефицит кадров, да и просто сложно очень организовать поток на 30+ серий. Несколько спринтов проще, чем один гигантский марафон.

1
Ответить