[Когнитивочка] Эвристика репрезентативности

Немножко поговорим об основах статистики и еще раз обсудим то, как человеческий мозг не умеет в теорию вероятности. В этот раз получился большой пост с большим количеством примеров.

Я уже писал в прошлом посте, что такое эвристика, поэтому здесь повторяться не буду.

Начнем с типичного примера, который почти всегда приводится в том или ином виде, когда рассматривается эвристика репрезентативности. Предположим, нам говорят, что вот это три результата бросков монетки:

1
1
2
2
3
3

Первая последовательность в большинстве случаев не вызывает у человека вопросов. А вот вторая и особенно третья кажутся нам странными. Просто потому что в нашем представлении они не похожи на то, как выглядит результат случайного процесса. Вторая — слишком уж ровное чередование, не похоже, что это случайно бросали. Третья — везде один вариант, такого тоже не бывает, нас обманывают, монетка бракованная. На самом деле, все эти последовательности имеют одинаковую вероятность:

0.390625%
Появился повод воспользоваться этим бесполезным виджетом для чисел, давно мечтал.

Все из-за эвристики репрезентативности. Обратимся к википедии:

Репрезентативность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана.

Как и все определения из русскоязычной википедии, это звучит слишком сложно, потому давайте разбираться на примерах. Репрезентативность — это вообще термин из статистики. Мы говорим, что выборка репрезентативна, если она хорошо описывает генеральную выборку. Генеральная выборка — это все многообразие предметов или событий, которое нас интересует. Например, мы хотим собрать статистику, как много людей пользуется интернетом. Генеральная выборка — это все люди мира. Мы не можем опросить их всех, поэтому надо взять относительно небольшую выборку людей и опросить их. Но эта выборка должна быть репрезентативной, мы не можем взять кого попало. Есть даже хороший анекдот на эту тему:

Опрос в интернете показал, что 100% людей пользуются интернетом

Здесь как раз высмеивается пример нерепрезентативной выборки. Есть еще один хороший пример — предварительные опросы избирателей перед президентскими выборами в США в 1936 году. Там исследователи опрашивали людей по телефону и не учли, что телефоны были в основном у богатых, а они преимущественно поддерживали республиканцев (википедия). Вообще, собрать репрезентативную выборку сложно, про это диссертации писать можно (наверное). Кстати, на основе случайной выборки раньше работал SteamSpy, пока Steam не сделали аккаунты игроков закрытыми по умолчанию. Не знаю, что там теперь, нужно у Галёнкина спрашивать.

Еще одна штука из статистики и теорвера, которая нам сейчас нужна — это закон больших чисел. Грубо говоря, он означает, что если у нас большое количество событий (в идеале бесконечное), то распределены они будут согласно тому, что мы от них ожидаем с точки зрения математики. Мы знаем, что вероятность выпадения каждой из сторон монетки равна 50%. Если бы мы бросили монетку миллиард раз, то там четко было бы видно 50% для орла и 50% для решки. Проблема в том, что человеческий мозг пытается применять закон больших чисел к маленьким выборкам. Если у нас всего 8 бросков, то это ни в коем случае не репрезентативная выборка, там может быть что угодно — любой из перечисленных вариантов на картинках выше.

В каком-то смысле эвристика репрезентативности работает в ситуациях, обратных тем, что мы рассмотрели в посте про эвристику доступности. Эвристика доступности работает, если нам нужно оценить вероятность какого-то события. Эвристика репрезентативности работает, если мы видим уже готовый результат какого-то события. Мозг берет этот результат, осматривает его со всех сторон и сравнивает с тем, как он себе сам представляет типичный результат этот события. Иногда это работает, иногда — нет.

Примеры

Смешной мем из интернета

[Когнитивочка] Эвристика репрезентативности

- Здесь у нас генератор случайных чисел

- 9, 9, 9, 9, 9, 9

- А вы уверены, что это случайные числа?

- В этом проблема случайности — ты никогда не можешь быть уверен.

Ошибка игрока или ложный вывод Монте-Карло

Это когнитивное искажение, из-за которого человек думает, что если на рулетке несколько раз подряд выпадает красное, то вероятность выпадания черного увеличивается. Хоть мы и знаем, что красное может выпасть сколько угодно раз подряд, так как это независимые события, из-за азарта и непонимания теории вероятности люди считают, что сейчас-то уж точно повезет, сейчас-то уж точно будет черное. Хотя я уверен, что если всегда будет выпадать красное, у людей появятся серьезные вопросы к этому казино.

У этого человека есть серьезные вопросы к этому казино.
У этого человека есть серьезные вопросы к этому казино.

Стереотипы и группы людей

Эвристика работает с выборками в целом, в том числе и с людьми. Возьмем для примера множество всех юристов. Мы их себе представляем в пиджаках и с дипломатами (например). Это будет наше генеральное множество. А теперь берем такого человека: кожаная куртка, рюкзак, темные очки, говорит, что он юрист, протягивает вам какую-то бумажку и просит подписать. Мозг берет все генеральное множество юристов из памяти, достает оттуда случайного юриста и сравнивает с человеком, которого он видит. Очевидно, тот странный человек не является репрезентативным представителем генерального множества юристов. Вообще, лучше у подозрительных людей ничего не подписывать.

Вот это юристы, вот это я понимаю, я бы подписал.
Вот это юристы, вот это я понимаю, я бы подписал.

Несколько промахов подряд в XCOM

Многим знакомая ситуация. Если вероятность попадания 90%, а вы постоянно промахиваетесь, это не игра сломана, это так работает случайность. Тут еще подмешиваются другие когнитивные искажения, например, систематическая ошибка отбора и склонность к подтверждению своей точки зрения. Вы можете несколько часов играть нормально, а потом дважды промахнетесь. Из-за эмоциональной привязки промахи запомнятся гораздо сильнее. А после этого, как бы редко они не случались, мозг уже будет подмечать все промахи и запоминать только их. И решит, что в XCOM только промахи и есть.

[Когнитивочка] Эвристика репрезентативности

Случайное воспроизведение песен в iPod

Говорят, когда только вышел iPod, люди жаловались, что случайное воспроизведение там плохо работает, так как почему-то один и тот же исполнитель может быть несколько раз подряд. Я думаю, вы уже понимаете, что проблема в людях, а не в iPod. В итоге, чтобы случайное воспроизведение ощущалось действительно случайным, его сделали менее случайным — алгоритм усложнили, чтобы он более равномерно подбирал песни разных исполнителей.

Пруфов истории у меня нет, прочитал про нее здесь, а там ссылаются на книгу Алекса Беллоса «Алекс в стране чисел. Необычайное путешествие в волшебный мир математики». Не читал, не знаю.

Традиционный котик
Традиционный котик
2424
15 комментариев

Комментарий недоступен

1

Скорее всего ты смешиваешь вероятность единичного события и совместную вероятность группы событий. Давай разберем на монетках. В рулетке просто есть еще зеро, поэтому там не 50%.

Вероятность выпадения орла или решки одинаковая - 50%. Пишем, P(орел) = 0.5, P(решка) = 0.5.
Бросаем монетку, вероятность выпадения любой стороны P(x) = 0.5. Бросаем монетку еще раз. У нее нет памяти, прошлые броски на нее не влияют, поэтому вероятность выпадения любой стороны все еще P(x) = 0.5.

А теперь взглянем на совместную вероятность. Для совместной вероятности есть теорема Байеса, но мы знаем, что броски монетки независимые, поэтому она упрощается.
Совместная вероятность независимых событий - это произведение их вероятностей.
Вероятность, что выпадет 2 решки подряд: P(решка) * P(решка) = 0.5 * 0.5 = 0.25.
Вероятность, что выпадет 4 решки подряд: P(решка) * P(решка) * P(решка) * P(решка) = 0.5 * 0.5 * 0.5 * 0.5 = 0.0625.
Вероятность, что выпадет 8 решек подряд: P(решка) в 8й степени = 0.5 ^ 8 = 0.00390625.

Поэтому да, вероятность того, что выпадет несколько решек подряд сильно уменьшается с каждой следующей решкой. Но вот вероятность каждой новой решки все еще 50%.

3

Комментарий недоступен

1

Отрицание или преуменьшение влияния когнитивных искажений на свои решения - это тоже когнитивное искажение :)
https://en.wikipedia.org/wiki/Bias_blind_spot

Меня больше раздражает подход "Раньше было лучше" - там тоже прям кладезь когнитивных искажений.

Комментарий недоступен

Проблема обучения теорверу на практике в том, что из-за когнитивных искажений можно сделать неправильные выводы.