Критерий Келли. Сколько ставить.
в прошлом эссе про покер я разобрал как профи решает как играть руку. Но есть вторая половина игры, которую зритель вообще не видит. Не «как сыграть эту раздачу», а «каким куском своих денег рискнуть».
| тема | вероятность · управление капиталом · логарифмический рост |
| читать | ~13 минут |
| связано | покер · EV · хорошие решения · игры построившие математику |
Это две совершенно разные задачи. Можно идеально играть каждую руку — считать диапазоны, выводить частоты блефа, реализовывать смешанные стратегии — и всё равно разориться. Потому что правильная игра отвечает на вопрос «какое решение имеет положительное матожидание». А вопрос «сколько денег на него ставить» — это отдельная математика. И она, на мой взгляд, даже красивее.
Зовут её критерий Келли. Это формула, которая отвечает на простой вопрос с неочевидным ответом: если у тебя есть преимущество, какой долей капитала рисковать чтобы расти максимально быстро и при этом не разориться?
И — что меня и зацепило — это ровно та же формула, по которой трейдеры считают размер позиции, а венчурные фонды распределяют деньги по сделкам. Снова та же история что и во всех прошлых эссе: математика родилась в азартной задаче и расползлась по всему миру.
Начну с проблемы. Она неинтуитивна, поэтому разберу на цифрах. Представь игру с явным преимуществом в твою пользу. Подбрасывается монета. Если орёл — тебе платят 2 к 1 (поставил рубль, получил два сверху). Если решка — теряешь ставку. Монета честная, 50 на 50.
Матожидание шикарное: половину времени выигрываешь 2, половину теряешь 1, средний результат +0.5 на каждый поставленный рубль. Это денежный станок. Любой аналитик скажет — играй. Вопрос: сколько ставить?
Наивный ответ — «всё, конечно, у меня же преимущество». Давай проверим. Ставишь весь капитал каждый раунд. Рано или поздно выпадет решка — а она выпадет, потому что вероятность 50% — и ты теряешь всё. Один проигрыш обнуляет тебя независимо от того, сколько ты до этого выиграл. Вероятность разорения на дистанции — стопроцентная. Станок с положительным матожиданием привёл к гарантированному нулю.
Другая крайность — ставить по рублю при капитале в миллион. Не разоришься никогда, но и растёшь черепашьим шагом, преимущество почти не используется. Где-то между «всё» и «копейка» есть оптимум. Точка, в которой капитал растёт максимально быстро на длинной дистанции. Эту точку и находит формула Келли.
Джон Келли в 1956 году вывел её в явном виде.1 Для простой ставки она выглядит так:
Разберу по буквам, это несложно: f* — оптимальная доля капитала, которую нужно поставить (если получается 0.25 — ставь четверть денег). p — вероятность выигрыша. q — вероятность проигрыша, то есть 1 − p. b — сколько ты выигрываешь на единицу ставки (в примере с монетой выигрыш 2 к 1, значит b = 2).
Подставим нашу монету: p = 0.5, q = 0.5, b = 2.
Ответ: ставить 25% капитала каждый раунд. Не всё. Не копейку. Четверть. В числителе формулы — по сути твоё чистое преимущество. В знаменателе — размер выплаты. Чем больше перевес — тем больше ставишь. Чем рискованнее выплата — тем осторожнее.
Есть удобная форма этой же формулы для ставок, где известны винрейт и отношение среднего выигрыша к среднему проигрышу:
где W — доля выигрышных ставок, R — отношение среднего выигрыша к среднему проигрышу. Это та форма, которой пользуются трейдеры: подставляешь исторический винрейт стратегии и среднее отношение прибыли к убытку — получаешь, какой долей счёта рисковать на сделку.
Теперь — самое математически красивое. Почему 25%, а не 30 или 20? Откуда вообще берётся эта формула?
Ключевая идея: деньги растут не сложением, а умножением. Если ты выиграл 50% и потом проиграл 50%, ты не вернулся к началу. Был рубль, стало 1.5, потом потеряли половину — стало 0.75. Ты в минусе, хотя «в среднем» плюс-минус ноль. Это и есть разница между арифметическим средним и геометрическим. Капитал живёт в геометрическом мире, где важно произведение результатов, а не их сумма.
А чтобы превратить произведение обратно в сумму — нужен логарифм. Поэтому Келли искал ставку, которая максимизирует среднее значение логарифма капитала:
где W — итоговый капитал. Максимизация ожидаемого логарифма капитала — это в точности максимизация скорости геометрического роста на длинной дистанции. Возьмёшь производную этого выражения по доле ставки, приравняешь к нулю — и выпадет ровно формула Келли.
Идея максимизировать логарифм богатства, а не само богатство, впервые появилась не у Келли. Её предложил Даниэль Бернулли в 1738 году — тот самый, с лотереей и петербургским парадоксом.2
Бернулли заметил, что люди ценят не сами деньги, а их логарифм: вторая тысяча рублей значит для тебя меньше, чем первая. Он назвал это полезностью. Через 218 лет Келли, решая задачу про шум в телефонных проводах, независимо пришёл к той же логарифмической функции — но уже как к стратегии оптимального роста. Одна и та же математика всплыла дважды, из совершенно разных вопросов.
История происхождения — отдельное удовольствие, потому что Келли не имел никакого отношения к азартным играм. Джон Келли работал в Bell Labs — той самой лаборатории, где Клод Шеннон создал теорию информации, и где Шеннон параллельно собирал шахматные автоматы. Келли занимался прозаической задачей: как передавать данные по телефонным линиям с шумом.
В 1956 году он опубликовал статью со скучным названием «Новая интерпретация скорости передачи информации».3 Она была про связь. Но внутри обнаружилась формула, которая отвечала на вопрос: если у тебя есть частичная, зашумлённая информация о будущем — какую долю капитала на неё ставить? Математика шума в проводах оказалась идентична математике ставок при неполной информации.
Сам Келли этим применением не занимался — он умер молодым, в 41 год, от кровоизлияния в мозг. У него есть ещё одна претензия на бессмертие: в 1961-м он с коллегой сделал первую в истории запись синтеза человеческого голоса — компьютер пел «Daisy Bell». Артур Кларк услышал эту запись в Bell Labs, и именно поэтому в «Космической одиссее 2001» умирающий HAL 9000 поёт ту же самую песню.
Связь Келли с играми протянул Шеннон. К нему пришёл студент MIT Эдвард Торп со своей системой подсчёта карт в блэкджеке. Шеннон отослал его к статье Келли. Торп применил формулу к блэкджеку, обыграл казино Лас-Вегаса, написал бестселлер «Beat the Dealer» (1962), а потом перенёс формулу с карточного стола на фондовый рынок. Основал хедж-фонд Princeton/Newport Partners, который десятилетиями показывал доходность без единого убыточного года.4 Сегодня критерий Келли — стандартная часть количественных финансов.
Теперь практическая тонкость, которую обязательно знают и покеристы, и трейдеры. Полный Келли (ставить ровно f*) математически максимизирует скорость роста. Но у него зверская дисперсия — те самые качели капитала. При полном Келли совершенно нормально потерять половину счёта во временной просадке, даже играя идеально. Большинство людей психологически этого не выдерживают.
Поэтому на практике почти все играют дробным Келли — чаще всего половинным. Ставят 0.5 × f*. Вот почему это умно: скорость роста при половинном Келли составляет около 75% от максимальной, а вот дисперсия падает вдвое. Ты жертвуешь четвертью скорости ради половины спокойствия.
Перебор в другую сторону — ставить больше Келли — катастрофичен и нелинеен. Поставишь вдвое больше оптимума — и твоя ожидаемая скорость роста становится отрицательной, при том что каждая отдельная ставка всё ещё плюсовая по матожиданию. Есть точка, после которой агрессия превращается в самоубийство, и Келли показывает где именно она находится.
В покере критерий Келли — это фундамент банкролл-менеджмента. Профи не садится за стол с лимитом, где один бай-ин это половина его денег, даже если он там фаворит. Правило «держи 20–30 бай-инов для кэша, 100+ для турниров» — это практическое огрубление Келли. Турниры требуют больше запаса, потому что у них выше дисперсия, а Келли прямо говорит: чем выше дисперсия, тем меньшей долей рискуй.
В трейдинге это называется position sizing. Та же формула f* = W − (1−W)/R. Трейдеры почти всегда используют дробный Келли — рынок шумнее блэкджека, оценки винрейта менее надёжны, и за переоценку преимущества наказывают жёстко.
В венчуре логика та же: не вкладывай в одну сделку столько, что один провал тебя выносит, даже если сделка прекрасна. Фонды диверсифицируют именно поэтому. Это Келли на уровне портфеля.
В жизни — да, и здесь тоже. Решение «уйти из найма в свой проект» — это ставка. Если поставить на неё всё (нет подушки, нет плана Б) — даже хорошая по матожиданию идея может тебя обнулить при первой полосе неудач. Келли формализует здравый смысл: масштабируй риск под свой запас прочности, а не под уверенность в правоте.
Главная мысль критерия Келли, если убрать формулы: матожидание говорит тебе что делать, а Келли говорит сколько на это ставить — и второй вопрос не менее важен.
Большинство людей, разобравшись с матожиданием, останавливаются. Но между «плюсовым решением» и «выживанием на дистанции» лежит целый математический слой про размер риска. И этот слой беспощаден: правильные по матожиданию решения, сделанные неправильным размером, ведут к гарантированному разорению. Не «могут привести». Ведут, с вероятностью единица, если повторять достаточно долго.
В этом для меня сходятся все эссе про игры. Кости научили человечество, что у будущего есть вероятности. Покер научил, как принимать решения внутри этих вероятностей. А Келли — как при этом не разориться, даже когда ты прав. Это третий, самый взрослый уровень: понимать, что недостаточно быть правым, нужно ещё дожить до момента, когда правота окупится.
Снова та же петля. Игра задала вопрос. Математике пришлось изобрести ответ. А ответ оказался про всю жизнь, а не только про игру.
«не важно, как часто ты прав. важно, сколько ты зарабатываешь когда прав, и сколько теряешь когда ошибаешься — и какой долей рискуешь в каждом случае.»
— переложение принципа Келли, часто приписывается Эдварду Торпу