теорема Байеса

визуал · №025

теорема Байеса

prior × likelihood → posterior. каждая точка — 1% популяции.

// сценарии

// параметры

P(H) — prior 5%

P(+|H) — sensitivity 90%

P(+|¬H) — FPR 9%

// prior P(H)

—

до наблюдения

// posterior P(H|+)

—

тест положительный

// posterior P(H|−)

—

тест отрицательный

// 100 точек = 100% популяции

TP — H верна, тест +

FN — H верна, тест −

FP — H ложна, тест +

TN — H ложна, тест −

—

// вычисление шаг за шагом

—

P(H)

—

P(+|H)

—

P(+)

—

P(H|+)

// формула

P(H|E) = P(E|H) × P(H) / P(E)

P(E) = P(E|H)×P(H) + P(E|¬H)×P(¬H)
posterior = likelihood × prior / нормировка

// обозначения

P(H)

prior — вероятность гипотезы до наблюдения

P(E|H)

likelihood — вероятность E при верной H

P(H|E)

posterior — вероятность H после наблюдения E

P(E)

нормировочная константа = P(E|H)×P(H) + P(E|¬H)×P(¬H)

P(¬H)

вероятность отрицания H = 1 − P(H)

likelihood ratio = P(E|H) / P(E|¬H) — сила свидетельства

// ключевые свойства

1 posterior одного наблюдения становится prior для следующего. байесовское обновление последовательно и инкрементально.

2 низкий prior убивает posterior даже при отличном тесте. это base rate fallacy — самая частая ошибка интерпретации.

3 LR > 1 — свидетельство в пользу H. LR < 1 — против H. LR = 1 — нейтральное свидетельство.

4 p-value ≠ P(H|данные). байесовский подход даёт P(H|данные) напрямую. частотный подход этого не умеет.