null
→x̄
мера · №002
регрессия к среднему
regression to the mean · после рекордно плохого почти всегда идёт улучшение, после рекордно хорошего — откат; это не причина, а арифметика случайности
обозначение→x̄ (стягивание к среднему)
определениеэкстремальные измерения при повторе склонны оказаться ближе к среднему, потому что часть экстремума была удачей, а удача не повторяется
ввёлФрэнсис Гальтон · 1886 · отсюда само слово «регрессия»
свойствапроявляется везде, где есть случайность · тем сильнее, чем слабее связь между повторами · порождает ложные причинные истории
связанокорреляция · дисперсия · ЦПТ · loss aversion
// развёрнуто в эссеРегрессия к среднему
эссе · ~470 слов · 4 мин

После рекорда всегда откат.

самое недооценённое явление в статистике. оно везде — и почти всегда его принимают за что-то другое.

Любой результат — это смесь двух частей: настоящего уровня и случайного шума. Когда ты наблюдаешь экстремум — рекордно высокий или рекордно низкий результат — это почти наверняка совпадение двух вещей сразу: высокий настоящий уровень и удачный шум в ту же сторону. При следующем замере настоящий уровень останется, а шум — нет, он отыграет назад. Результат сдвинется к среднему. Не потому что что-то изменилось. Потому что удача не повторяется по заказу.

Слово ввёл Гальтон в 1886-м. Он измерял рост родителей и детей: у очень высоких родителей дети в среднем выше нормы — но ниже родителей, ближе к среднему. У очень низких — наоборот. Гальтон назвал это «регрессией к посредственности». Из этой работы родилась заодно и корреляция: r измеряет, насколько сильно повтор тянет к среднему1.

А дальше — главное, ради чего этот объект существует. Регрессия к среднему постоянно маскируется под причинно-следственную связь, и мозг радостно покупается.

Канеман рассказывал про инструкторов ВВС2. Они заметили: похвалишь курсанта за отличный полёт — следующий хуже; отругаешь за ужасный — следующий лучше. Вывод инструкторов: похвала расслабляет, наказание мобилизует. Вывод неверный. Отличный полёт был верхним выбросом — за ним откат к среднему в любом случае, хвали не хвали. Ужасный был нижним — за ним улучшение независимо от ругани. Инструкторы приписали причину тому, что было чистой регрессией. И, что хуже, выучили ложный урок: «наказание работает».

Регрессия к среднему — это тишина после шума, которую вечно принимают за чей-то голос.

Эта ловушка повсюду. «Проклятие обложки»: спортсмен попадает на обложку журнала на пике формы (мастерство плюс везение) — дальше закономерный спад, который называют проклятием. Новое лекарство «помогает»: его начинают принимать в худший момент болезни — а после худшего почти всегда легчает само. Компания меняет CEO после провального года — следующий год лучше, и заслугу приписывают новому боссу. Везде один скелет: к экстремуму подгоняют героя или причину, хотя сработала статистика.

Связь с искажениями прямая. Мы видим причину там, где есть только откат, потому что мозг не выносит случайности — ему нужна история с действующим лицом. «Стало лучше после X» почти всегда читается как «X помог», даже если X был гомеопатией, а помогло время.

Что делать. Перед тем как объяснять улучшение после провала (или спад после успеха) чьей-то заслугой или виной — спроси: а не вернулось ли всё просто к среднему? Если меришь что-то на экстремуме, жди отката и не записывай его в эффект. В A/B и аналитике: не запускай изменение в ответ на разовый выброс метрики — следующая точка и так подтянется, и ты припишешь это своему вмешательству.