| обозначение | →x̄ (стягивание к среднему) |
| определение | экстремальные измерения при повторе склонны оказаться ближе к среднему, потому что часть экстремума была удачей, а удача не повторяется |
| ввёл | Фрэнсис Гальтон · 1886 · отсюда само слово «регрессия» |
| свойства | проявляется везде, где есть случайность · тем сильнее, чем слабее связь между повторами · порождает ложные причинные истории |
| связано | корреляция · дисперсия · ЦПТ · loss aversion |
После рекорда всегда откат.
самое недооценённое явление в статистике. оно везде — и почти всегда его принимают за что-то другое.
Любой результат — это смесь двух частей: настоящего уровня и случайного шума. Когда ты наблюдаешь экстремум — рекордно высокий или рекордно низкий результат — это почти наверняка совпадение двух вещей сразу: высокий настоящий уровень и удачный шум в ту же сторону. При следующем замере настоящий уровень останется, а шум — нет, он отыграет назад. Результат сдвинется к среднему. Не потому что что-то изменилось. Потому что удача не повторяется по заказу.
Слово ввёл Гальтон в 1886-м. Он измерял рост родителей и детей: у очень высоких родителей дети в среднем выше нормы — но ниже родителей, ближе к среднему. У очень низких — наоборот. Гальтон назвал это «регрессией к посредственности». Из этой работы родилась заодно и корреляция: r измеряет, насколько сильно повтор тянет к среднему1.
А дальше — главное, ради чего этот объект существует. Регрессия к среднему постоянно маскируется под причинно-следственную связь, и мозг радостно покупается.
Канеман рассказывал про инструкторов ВВС2. Они заметили: похвалишь курсанта за отличный полёт — следующий хуже; отругаешь за ужасный — следующий лучше. Вывод инструкторов: похвала расслабляет, наказание мобилизует. Вывод неверный. Отличный полёт был верхним выбросом — за ним откат к среднему в любом случае, хвали не хвали. Ужасный был нижним — за ним улучшение независимо от ругани. Инструкторы приписали причину тому, что было чистой регрессией. И, что хуже, выучили ложный урок: «наказание работает».
Регрессия к среднему — это тишина после шума, которую вечно принимают за чей-то голос.
Эта ловушка повсюду. «Проклятие обложки»: спортсмен попадает на обложку журнала на пике формы (мастерство плюс везение) — дальше закономерный спад, который называют проклятием. Новое лекарство «помогает»: его начинают принимать в худший момент болезни — а после худшего почти всегда легчает само. Компания меняет CEO после провального года — следующий год лучше, и заслугу приписывают новому боссу. Везде один скелет: к экстремуму подгоняют героя или причину, хотя сработала статистика.
Связь с искажениями прямая. Мы видим причину там, где есть только откат, потому что мозг не выносит случайности — ему нужна история с действующим лицом. «Стало лучше после X» почти всегда читается как «X помог», даже если X был гомеопатией, а помогло время.
Что делать. Перед тем как объяснять улучшение после провала (или спад после успеха) чьей-то заслугой или виной — спроси: а не вернулось ли всё просто к среднему? Если меришь что-то на экстремуме, жди отката и не записывай его в эффект. В A/B и аналитике: не запускай изменение в ответ на разовый выброс метрики — следующая точка и так подтянется, и ты припишешь это своему вмешательству.