null
[─]
вывод · №002
доверительный интервал
95% CI · Neyman · 1937 · интервальная оценка параметра
обозначениеCI (confidence interval) · [L, U]
определениеинтервал, построенный по процедуре, которая в 95% случаев содержит истинный параметр
ввёлJerzy Neyman · 1937
формулаx̄ ± zα/2 · σ/√n
стандарт95% CI → z = 1.96 · 99% CI → z = 2.576
НЕ являетсяинтервалом, где параметр находится с вероятностью 95%
связаноp-value · размер эффекта · A/B тестирование

эссе · ~400 слов · 3 мин

Что доверительный интервал не означает.

самое распространённое заблуждение в статистике.

95% доверительный интервал — это НЕ интервал, в котором истинный параметр находится с вероятностью 95%. Самое распространённое заблуждение в статистике.

Формально: 95% CI — это процедура. Если повторить эксперимент много раз и каждый раз строить CI по той же процедуре — 95% таких интервалов будут содержать истинный параметр1.

Истинный параметр θ — фиксированное число. Не случайная величина. Конкретный построенный интервал [L, U] либо содержит θ, либо нет. Вероятность 95% — свойство процедуры, не конкретного интервала.

«95% интервалов из 100 экспериментов содержат истинное значение» — это правильная интерпретация. «Параметр в этом интервале с вероятностью 95%» — неправильная.

Практически: чем уже CI, тем точнее оценка. Ширина CI зависит от размера выборки (√n в знаменателе), дисперсии данных и уровня доверия.

Байесовский аналог — credible interval. «Параметр с вероятностью 95% находится в [L, U]» — это credible interval, не confidence interval2. Требует prior. Зато интерпретируется так, как хочется.