визуал · №025
теорема Байеса
prior × likelihood → posterior. каждая точка — 1% популяции.
// сценарии
// параметры
P(H) — prior
5%
P(+|H) — sensitivity
90%
P(+|¬H) — FPR
9%
// prior P(H)
—
до наблюдения
// posterior P(H|+)
—
тест положительный
// posterior P(H|−)
—
тест отрицательный
// 100 точек = 100% популяции
TP — H верна, тест +
FN — H верна, тест −
FP — H ложна, тест +
TN — H ложна, тест −
—
// вычисление шаг за шагом
—
P(H)
—
P(+|H)
—
P(+)
—
P(H|+)
// формула
P(H|E) = P(E|H) × P(H) / P(E)
P(E) = P(E|H)×P(H) + P(E|¬H)×P(¬H)
posterior = likelihood × prior / нормировка
posterior = likelihood × prior / нормировка
// обозначения
P(H)
prior — вероятность гипотезы до наблюдения
P(E|H)
likelihood — вероятность E при верной H
P(H|E)
posterior — вероятность H после наблюдения E
P(E)
нормировочная константа = P(E|H)×P(H) + P(E|¬H)×P(¬H)
P(¬H)
вероятность отрицания H = 1 − P(H)
LR
likelihood ratio = P(E|H) / P(E|¬H) — сила свидетельства
// ключевые свойства
1
posterior одного наблюдения становится prior для следующего. байесовское обновление последовательно и инкрементально.
2
низкий prior убивает posterior даже при отличном тесте. это base rate fallacy — самая частая ошибка интерпретации.
3
LR > 1 — свидетельство в пользу H. LR < 1 — против H. LR = 1 — нейтральное свидетельство.
4
p-value ≠ P(H|данные). байесовский подход даёт P(H|данные) напрямую. частотный подход этого не умеет.