два алфавита.
Вся статистика записана двумя алфавитами: греческим — для генеральной совокупности, латинским — для выборки. За этим стоят два человека, которые терпеть не могли друг друга.
| тема | история статистики · нотация · Пирсон · Фишер |
| читать | ~6 минут |
| связано | корреляция · дисперсия · p-value · греческий и латинский алфавиты |
Карл Пирсон был старшим. На рубеже веков он построил статистику почти с нуля: развил коэффициент корреляции, ввёл само слово «стандартное отклонение» и букву σ, придумал критерий хи-квадрат, основал первый в мире журнал современной статистики — Biometrika — и первую кафедру статистики1. Его главный сдвиг был философским: до него наука думала причинами, после — корреляциями. «До 1889 года люди науки мыслили только причинностью; впредь им предстояло принять и другую категорию — корреляцию», писал он сам2. Пирсон дал статистике латинские буквы выборки — x̄, s, r — то, что считаешь руками из данных.
Рональд Фишер был младшим и почти во всём противоположностью. Там, где Пирсон измерял и описывал, Фишер строил теорию вывода. Он ввёл понятие дисперсии (1918), придумал дисперсионный анализ, метод максимального правдоподобия, основы планирования экспериментов и проверки значимости3. А в 1922 провёл черту, которой статистика пользуется до сих пор: разделил «параметр» — истинную характеристику генеральной совокупности — и «статистику», её оценку по выборке4. Параметрам он отдал греческие буквы: μ, σ, ρ. Величины, которые существуют, но почти не видны. Это и есть второй алфавит.
А дальше начинается вражда. Пирсон был редактором Biometrika и не пускал Фишера в печать. Одну из его работ он согласился напечатать только сноской — к собственной, куда более длинной статье5. Фишер унёс свой дисперсионный анализ в «Журнал сельскохозяйственной науки» и затаил обиду. Ссора пережила Пирсона: когда его сын Эгон вместе с Ежи Нейманом переплавили идеи Фишера в проверку «нулевой против альтернативной» гипотезы, Фишер возненавидел и это6. В 1933, когда Пирсон ушёл в отставку, его кафедру в University College поделили надвое — между Фишером и Эгоном Пирсоном. Два врага в одном здании.
Каждый раз, когда ты пишешь s, чтобы оценить σ, — ты повторяешь их разделение труда. Латинская буква Пирсона тянется к греческой букве Фишера. Рукопожатие, которого не было.
И ещё одно, без чего эссе было бы нечестным. Оба строили свою статистику внутри евгеники. Пирсон возглавлял Галтоновскую лабораторию национальной евгеники и держал первую в стране кафедру евгеники; после него лабораторию возглавил Фишер7. Корреляция, значимость, дисперсия рождались в том числе как инструмент аргументов о наследственности и «расовых» различиях. В 2020 University College убрал имя Пирсона со своих зданий, а в 2021 принёс формальные извинения за своё евгеническое прошлое8. Математика пережила идеологию, которая её питала, — и об этом стоит помнить, когда мы этой математикой пользуемся. (Фишер, к слову, до конца жизни отрицал, что курение вызывает рак, уверяя, что связь может быть мнимой: мастер различать корреляцию и причинность сам споткнулся на этом различении.)9
Но буквы остались. Греческое — истина, латинское — оценка. Самое чистое разделение во всей статистике придумали двое, не разговаривавших друг с другом, — и работает оно безупречно именно потому, что каждый тянул в свою сторону.