null
эссе · вероятность · рынки · ~12 мин

букмекер думает по Байесу.

Открой приложение по ходу матча — и число живёт. Бразилия повела 1:0, и её шанс на победу подскочил прямо у тебя на глазах. За этим дёргающимся коэффициентом — теорема Байеса, запущенная в реальном времени. Разберём, из чего именно он считается, и где честная вероятность заканчивается, а начинается бизнес.

Сразу уговор: коэффициент и вероятность — это одно и то же, просто записанное по-разному. Если десятичный кэф равен 2.5, то зашитая в него вероятность — это единица, делённая на кэф.

P ≈ 1 / кэф  →  1 / 2.5 = 0.40
кэф 2.5 значит «букмекер оценивает это в ~40%». чем меньше кэф — тем выше его вера.

Так что весь матч букмекер, по сути, вслух произносит свою вероятность — и переписывает её после каждого события. Вопрос только в том, откуда он её берёт и как пересчитывает.

откуда априор · пуассон считает голы

До свистка нужна стартовая вероятность — априор. Её даёт модель. Для футбола классика — это Пуассон: предполагаем, что голы команды капают редко и независимо со средней интенсивностью λ, и тогда вероятность забить ровно k мячей считается формулой.[1]

P(k голов) = λk · e−λ / k!
пусть команда в среднем забивает λ = 1.4 за матч. тогда:
P(0) = e−1.425% · P(1) ≈ 35% · P(2) ≈ 24% · P(3) ≈ 11%

Берёшь λ для каждой команды (из рейтингов, формы, силы соперника), перемножаешь два распределения — и получаешь вероятность любого счёта, а из счетов складываешь вероятность победы, ничьей, поражения. Это и есть тот самый априор, который ляжет на табло до начала.

почему сумма всегда больше ста · маржа

Теперь маленький фокус, на котором стоит вся индустрия. Сложи зашитые вероятности всех исходов — и получится больше 100%. Это не ошибка, это навар.

дом 2.10 · ничья 3.40 · гости 3.80
1/2.10 + 1/3.40 + 1/3.80 = 47.6% + 29.4% + 26.3% = 103.3%
лишние 3.3% — это маржа (overround). честные вероятности дают 100%; всё, что сверху, — встроенное преимущество дома.

То есть коэффициент — это не чистая вера букмекера, а его вера, ужатая на маржу в свою пользу. Запомни это: дальше всё про честную вероятность, а наценка просто едет сверху.

живая модель · вера, которая дышит

Свисток — и начинается главное. Модель не стоит на месте: каждую секунду она пересчитывает λ и вероятности по тому, что творится на поле. Минута, счёт, удаления, ожидаемые голы по моментам (xG), территория, темп — всё это входы. Апостериор обновляется не раз, а непрерывно. В теннисе число пересчитывается после каждого розыгрыша, в баскетболе — после каждого владения. Линия не висит — она дышит.

100 75 50 25 гол A · 30' гол B · 62' гол A · 80' ⏸ пауза рутина — лёгкий дрейф · гол — прыжок 90'
линия P(победа A) по ходу матча: между событиями дрейфует, на голе прыгает и замирает на пересчёт

гол · пересчёт в числах

Вот где Байес виден буквально. До гола на 30-й минуте дом оценивали, скажем, в 45% — это шансы примерно 45 к 55. Дом забивает. Модель смотрит: впереди ещё час, счёт 1:0, и пересчитывает — пусть теперь 68%. Переведём оба в шансы и поделим — получим, во сколько раз гол сдвинул веру. Это и есть отношение правдоподобий, сила улики.

шансы после = шансы до × LR
68:32 = 45:55 × 2.6
гол оказался уликой силой ≈ 2.6× в пользу победы дома. кэф при этом едет с ~2.2 до ~1.47 в ту же секунду.

Почему сдвиг такой резкий? Потому что гол — сенсация: в любую отдельную минуту он маловероятен, а значит несёт много информации. Если в данный отрезок гол ждали с вероятностью около 3%, то его «удивительность» — это −log₂(0.03) ≈ 5 бит. Рутинный пас несёт почти ноль бит и веру не двигает; гол приносит пять — и линия прыгает.[2] Поэтому на голе приложение на пару секунд замораживает рынок: модель пересчитывает апостериор, прежде чем пустить новый кэф.[3] Тонко, что рынок часто чует гол заранее — затяжное давление поднимает xG, и вероятность забивающей команды ползёт вверх ещё до мяча в сетке.[4]

где Байес заканчивается · бизнес

Всё, что выше, — честный пересчёт вероятности. Дальше начинается то, чего в теореме нет. Маржу мы уже видели — она едет сверху. Второе — баланс книги: дом хочет остаться в плюсе при любом исходе. До матча это делают, двигая линию, пока деньги на стороны не уравновесятся. Но в лайве этот приём почти не работает: ставки идут против дома и реагируют мгновенно, поэтому линию правят на лету, при перекосе просто закрывают рынок, а маржу в быстром лайве закладывают побольше — на риск резких скачков.[5] Чистый байесовец считает истинную вероятность; букмекер считает её же — и продаёт тебе с наценкой.

где всё ломается · гонка за информацией

Вся конструкция держится на скорости. Главный враг — задержка. Зритель на стадионе видит гол на две-три секунды раньше, чем фид дойдёт до букмекера, и успевает ударить по не обновившейся линии: это кортсайдинг, латентный арбитраж.[6] Ради миллисекунд площадки шлют не всю линию, а только дельту изменения — экономя до 90% трафика. По сути живой беттинг — непрерывная гонка: у кого свежее улика, тот и прав.

Букмекер — это байесовец, которому ещё надо платить за аренду: он обновляет веру на каждой улике, но снимает маржу и боится того, у кого глаза быстрее.

Так что живая линия в приложении — это твоя река вероятности из симуляции турнира, только поматчево и в реальном времени, плюс два слоя сверху. Под витриной — чистый Байес: априор от Пуассона и рейтингов, апостериор, пересчитанный на каждом событии, скачок тем больше, чем невероятнее улика. Кэф 1.47 на табло — это просто чья-то вера в ~68%, ужатая на маржу, которую тебе продают заново каждую секунду.

на полях
[1]Пуассоновская модель: голы редки и независимы со средней интенсивностью λ, P(k) = λ^k·e^−λ/k!. Махер (1982), уточнение Диксона–Коулза (1997). λ каждой команды → распределение счёта → вероятность исхода.
[2]Удивительность события −log₂P в битах. Маловероятный гол несёт много бит → большой сдвиг апостериора; рутина ≈ 0 бит. Связь Байеса с теорией информации.
[3]На голе/удалении live-площадки на пару секунд приостанавливают рынок («suspend»), пока модель пересчитывает линию.
[4]Рынок часто предвосхищает гол: давление поднимает implied-вероятность забивающей команды ещё до гола (показано на данных Бундеслиги).
[5]P ≈ 1/кэф; сумма по исходам > 100% — маржа (overround). В лайве баланс книги через сдвиг линии почти недоступен (ставки против дома, реакция мгновенна), поэтому правят на лету и закрывают рынок при перекосе.
[6]Кортсайдинг / латентный арбитраж: зритель видит событие на 2–3 секунды раньше фида. Ради скорости рассылают только дельту, экономя до 90% трафика.