Парадоксы вероятности.
вероятность — область где интуиция врёт особенно уверенно. не потому что люди глупы. потому что мозг не создан для вероятностного мышления. четыре задачи которые ломают интуицию.
| тема | вероятность · парадоксы · интуиция |
| читать | ~8 минут |
| связано | байесовский вывод · задача Монти Холл · парадоксы бесконечности |
Вероятность — область где интуиция врёт особенно уверенно. Не потому что люди глупы. Потому что мозг эволюционировал не для вероятностного мышления. Вот четыре задачи которые это доказывают.
В комнате 23 человека. Какова вероятность что у двух из них одинаковый день рождения?
Интуиция говорит: мало. 23 человека из 365 дней — около 6%. Правильный ответ: 50.7%1.
Почему? Мы считаем не пары человек/день — а пары человек/человек. 23 человека дают C(23,2) = 253 пары. Для каждой пары — вероятность совпадения 1/365.
P(есть совпадение) ≈ 0.507.
При 70 людях вероятность совпадения > 99.9%. Интуиция думала о паре «я и кто-то». Математика считает все пары.
Три двери. За одной — автомобиль. За двумя — козы. Вы выбираете дверь 1. Ведущий (знающий где автомобиль) открывает дверь 3 — там коза. Менять выбор на дверь 2 или остаться?
Интуиция: без разницы. 50/50. Правильный ответ: менять. Вероятность при смене — 2/32.
Почему? Ведущий не случайно открывает дверь. Он знает где автомобиль и всегда открывает дверь с козой. Это информация которая меняет вероятности.
автомобиль за дверью 2 или 3 (2/3) — смена выигрывает.
ведущий всегда откроет оставшуюся козью дверь. смена выигрывает в 2/3 случаев.
Когда Мэрилин вос Савант опубликовала этот ответ в 1990 году она получила тысячи писем от математиков и профессоров с требованием признать ошибку. Все они ошибались.
Больница A: вылечила 800 из 1000 тяжёлых и 900 из 1000 лёгких. Больница B: вылечила 400 из 500 тяжёлых и 800 из 1000 лёгких.
тяжёлые A = 80% · B = 80% — одинаково.
лёгкие A = 90% · B = 80% — A лучше.
Но агрегированно можно получить обратный результат если одна больница принимает больше тяжёлых пациентов.
Парадокс Симпсона3: агрегированный тренд может противоречить трендам в каждой подгруппе. Это происходит когда конфаундер (тяжесть болезни) коррелирует и с группой и с исходом.
В данных о зарплатах, лечении, спорте — Симпсон встречается регулярно. Прежде чем делать вывод из агрегата — проверь подгруппы.
В круге радиуса 1 случайно выбирается хорда. Какова вероятность что хорда длиннее стороны вписанного равностороннего треугольника (длина = √3)?
Жозеф Бертран в 1889 году дал три правильных ответа4: 1/2, 1/3 и 1/4 — в зависимости от того что значит «случайно выбрать хорду».
равномерный выбор угла и расстояния → 1/3.
равномерный выбор конечных точек → 1/2.
Три разных ответа — все верные. Потому что «случайно» не определено однозначно. Вопрос поставлен неправильно.
Парадокс Бертрана учит: вероятность не существует без вероятностного пространства. «Случайный» объект требует точного распределения. Без него вопрос лишён смысла.
Все четыре парадокса об одном: интуиция считает неправильные объекты. День рождения — пары, не одиночки. Монти Холл — информация, не симметрия. Симпсон — подгруппы, не агрегат. Бертран — распределение, не «случайность».
Лечение — осознать что именно ты считаешь. Нарисовать. Написать формально. Вероятность не терпит небрежности.
«вероятность — наиболее важная концепция в современной науке особенно потому что никто не имеет ни малейшего представления о том что она означает.»
— Бертран Рассел