null
p
вывод · №001
p-value
вероятность данных при верной нулевой гипотезе · не вероятность гипотезы
обозначениеp · от probability
определениеP(данные | H₀) — вероятность данных при верной H₀
ввёлКарл Пирсон · 1900 · термин закрепил Фишер · 1925
порогα = 0.05 — условный стандарт, не закон природы
НЕ являетсявероятностью того, что H₀ верна
НЕ являетсявероятностью ошибки
связаноA/B тестирование · ошибка I рода · мощность теста

эссе · ~400 слов · 3 мин

Что p-value значит на самом деле.

одна из самых используемых и неправильно понимаемых статистических концепций.

Формально: p-value — вероятность получить результат не менее экстремальный, чем наблюдаемый, если нулевая гипотеза верна. P(T ≥ tobs | H₀).

Что это не означает:

  • вероятность, что H₀ верна: P(H₀ | данные) ≠ p-value;
  • вероятность ошибки: «мы ошиблись с вероятностью 5%»;
  • размер эффекта: маленький p не значит большой эффект;
  • практическую значимость.

Что это означает: если нулевая гипотеза верна (эффекта нет), как вероятно получить такие данные или более экстремальные? Малый p-value говорит: данные маловероятны при H₀. Это основание отвергнуть H₀ — но не доказательство, что H₁ верна.

«Статистически значимо» — не синоним «правда».

Порог 0.05 — исторически случаен. Фишер предложил его как «удобный» в 1925 году1. Для физики используют 5σ (p ≈ 0.0000003). Для медицины иногда 0.01. Контекст определяет порог — не наоборот.

Два p-value, которые обманывают:

  1. p = 0.049 и p = 0.051 — статистически «разные». Реально — практически одинаковые.
  2. p < 0.001 при n = 1 000 000 — статистически значимо при минимальном эффекте. Большая выборка делает любой эффект «значимым»2.