null
эссе · нотация · история · ~650 слов · 6 мин

два алфавита.

Вся статистика записана двумя алфавитами: греческим — для генеральной совокупности, латинским — для выборки. За этим стоят два человека, которые терпеть не могли друг друга.

темаистория статистики · нотация · Пирсон · Фишер
читать~6 минут
связанокорреляция · дисперсия · p-value · греческий и латинский алфавиты

Карл Пирсон был старшим. На рубеже веков он построил статистику почти с нуля: развил коэффициент корреляции, ввёл само слово «стандартное отклонение» и букву σ, придумал критерий хи-квадрат, основал первый в мире журнал современной статистики — Biometrika — и первую кафедру статистики1. Его главный сдвиг был философским: до него наука думала причинами, после — корреляциями. «До 1889 года люди науки мыслили только причинностью; впредь им предстояло принять и другую категорию — корреляцию», писал он сам2. Пирсон дал статистике латинские буквы выборки — x̄, s, r — то, что считаешь руками из данных.

Рональд Фишер был младшим и почти во всём противоположностью. Там, где Пирсон измерял и описывал, Фишер строил теорию вывода. Он ввёл понятие дисперсии (1918), придумал дисперсионный анализ, метод максимального правдоподобия, основы планирования экспериментов и проверки значимости3. А в 1922 провёл черту, которой статистика пользуется до сих пор: разделил «параметр» — истинную характеристику генеральной совокупности — и «статистику», её оценку по выборке4. Параметрам он отдал греческие буквы: μ, σ, ρ. Величины, которые существуют, но почти не видны. Это и есть второй алфавит.

А дальше начинается вражда. Пирсон был редактором Biometrika и не пускал Фишера в печать. Одну из его работ он согласился напечатать только сноской — к собственной, куда более длинной статье5. Фишер унёс свой дисперсионный анализ в «Журнал сельскохозяйственной науки» и затаил обиду. Ссора пережила Пирсона: когда его сын Эгон вместе с Ежи Нейманом переплавили идеи Фишера в проверку «нулевой против альтернативной» гипотезы, Фишер возненавидел и это6. В 1933, когда Пирсон ушёл в отставку, его кафедру в University College поделили надвое — между Фишером и Эгоном Пирсоном. Два врага в одном здании.

Каждый раз, когда ты пишешь s, чтобы оценить σ, — ты повторяешь их разделение труда. Латинская буква Пирсона тянется к греческой букве Фишера. Рукопожатие, которого не было.

И ещё одно, без чего эссе было бы нечестным. Оба строили свою статистику внутри евгеники. Пирсон возглавлял Галтоновскую лабораторию национальной евгеники и держал первую в стране кафедру евгеники; после него лабораторию возглавил Фишер7. Корреляция, значимость, дисперсия рождались в том числе как инструмент аргументов о наследственности и «расовых» различиях. В 2020 University College убрал имя Пирсона со своих зданий, а в 2021 принёс формальные извинения за своё евгеническое прошлое8. Математика пережила идеологию, которая её питала, — и об этом стоит помнить, когда мы этой математикой пользуемся. (Фишер, к слову, до конца жизни отрицал, что курение вызывает рак, уверяя, что связь может быть мнимой: мастер различать корреляцию и причинность сам споткнулся на этом различении.)9

Но буквы остались. Греческое — истина, латинское — оценка. Самое чистое разделение во всей статистике придумали двое, не разговаривавших друг с другом, — и работает оно безупречно именно потому, что каждый тянул в свою сторону.