четыре лица теоремы Байеса.
Сначала познакомимся с формулой — без испуга. Есть гипотеза (H): то, во что мы прикидываем, верить или нет. И есть улика (E): то, что мы только что узнали. Байес говорит, как пересчитать одно через другое.
Четыре кусочка, и каждый честно про своё:
prior
likelihood
evidence · marginal
posterior
А дальше — четыре способа всё это прочитать. Один и тот же фокус, разные ракурсы.
i · людьми, а не процентами
Проще всего не запутаться, если бросить жонглировать процентами и пересчитать живых людей. Болезнь редкая — один на тысячу. Возьмём тысячу человек. Болен один, тест его поймает. Но среди 999 здоровых прибор тоже изредка ошибётся — и наберётся полсотни ложных тревог. И вот тест звякнул «плюс» у пятидесяти одного, а болен из них один. Около двух процентов, а не девяноста девяти. Проценты это прятали — люди показали.
ii · шансы: улики просто складываются
Тут начинается самое рабочее. Переведём вероятность в шансы — как у букмекера, «один к девяти». Формула превращается в умножение: берёшь шансы до, домножаешь на силу улики — получаешь шансы после. Сила улики — это во сколько раз увиденное вероятнее, если гипотеза верна, чем если нет.
Красота в том, что весь «фон» сокращается: не нужно считать вселенную, нужно лишь сравнить две версии. А улики идут одна за другой и просто перемножаются — ровно так живёт спам-фильтр: каждое подозрительное слово домножает шансы, что письмо мусорное. А если взять логарифм, умножение станет сложением — и улики можно складывать в столбик.
iii · облако вместо точки
Иногда вопрос не «да или нет», а «насколько». Насколько сильна команда. Какая на самом деле конверсия у фичи. Тогда вера — не одно число, а целое облако: где-то гуще, где-то реже. Приходят данные — облако сжимается и сдвигается. Ты не просто меняешь оценку — ты становишься в ней увереннее: широкое «да кто ж знает» превращается в узкое «почти наверняка вот столько». Когда посчитать руками нельзя, это облако набрасывают тысячами случайных проб — это MCMC.
iv · насколько это вообще новость
Последний угол — про вес новостей. Скучное, ожидаемое событие почти ничего не сообщает и веру двигать не должно. Сенсация — наоборот: несёт много информации (её и меряют в битах) и потому разворачивает мнение сильно. Бразилия обыграла аутсайдера — так и должно быть, веришь как верил. Бразилия влетела 0:4 — вот это новость, вот это меняет картину. Чем невероятнее случившееся, тем сильнее оно обязано тебя двигать. Удивление и есть мера обновления.
∴ · один фокус, четыре ракурса
Всё это — не четыре теоремы, а одна, рассказанная на четырёх языках: людьми, шансами, облаками, битами. Какой выбрать — зависит от задачи. Медтест удобнее считать людьми. Копить улики и болеть за футбол — шансами. Оценивать величину — облаками. Прикидывать вес новости — битами.
В шансах вера складывается: прибавляй вес каждой улики, пока сумма не перевесит.
Так, между прочим, помогли выиграть войну. В Блетчли-Парке Тьюринг и Джек Гуд взламывали «Энигму» не магией, а ровно этим сложением: каждая зацепка добавляла свои децибаны — единички веса улики, — и когда столбик дорастал до нужного, шифр считался разгаданным.[2] Один децибан они отмерили как самую малую крупицу довода, которую ещё чует человеческое чутьё. Выходит, Байес, шансы и информация — одна монета, просто повёрнутая разными гранями. А весь навык — менять мнение ровно на вес того, что узнал. Ни упрямее, ни легковернее.