Эргодичность. Почему среднее вам не достанется.
есть игра с положительным матожиданием, в которую нельзя играть. звучит как противоречие. это не противоречие — это, возможно, самая недооценённая идея во всей теории решений, и родом она из физики газов.
| тема | неопределённость · эргодичность · время · риск разорения |
| читать | ~20 минут |
| связано | критерий Келли · разорение игрока · EV · чёрный лебедь |
Вот игра. Ставишь все свои деньги, бросаешь честную монету. Орёл — состояние растёт на 50%. Решка — падает на 40%. Монета честная, 50 на 50, можно играть сколько угодно раз подряд.
Посчитаем матожидание одного броска. Половину времени ×1.5, половину ×0.6. Среднее: (1.5 + 0.6) / 2 = 1.05. Плюс пять процентов за бросок. Это феноменальная доходность — 5% за подбрасывание монеты. EV кричит: играй, и играй как можно больше, это денежная печатная машинка.
Теперь сыграй по-настоящему — проследи одну траекторию во времени. Пусть выпадает идеально поровну: орёл, решка, орёл, решка. После орла ×1.5, после решки ×0.6. Два броска: 1.5 × 0.6 = 0.9. Минус десять процентов за пару, в которой выпало поровну. Продолжай — и состояние ползёт к нулю неумолимо. Почти любой, кто играет в эту игру достаточно долго, разоряется. При железно положительном матожидании.
Игра выгодна по EV — и разоряет почти каждого, кто в неё играет. Это не парадокс и не фокус. Это эргодичность, и, разобравшись в ней, ты перестанешь смотреть на матожидание как на окончательный ответ.
Разгадка в том, что слово «среднее» прячет два разных понятия, которые мы по привычке считаем одним.
Первое — среднее по ансамблю. Возьми тысячу человек, пусть каждый сыграет один раз, сложи итоги, подели на тысячу. Примерно у половины ×1.5, у половины ×0.6, среднее по толпе — те самые +5%. Это снимок поперёк множества судеб в один момент времени.
Второе — среднее по времени. Возьми одного человека, пусть играет тысячу раз подряд, усредни то, что происходит вдоль его траектории. И тут вылезает минус: он разоряется. Это среднее вдоль одной судьбы, протянутой во времени.
Матожидание — это всегда среднее по ансамблю. Оно отвечает на вопрос «что будет в среднем с тысячей параллельных копий меня в один момент». Но ты не тысяча копий. Ты одна копия, которая живёт во времени, одну-единственную траекторию, где исход каждого броска становится почвой для следующего. Тебе нужно среднее по времени — а оно здесь другое, и не на чуть-чуть, а с противоположным знаком1.
Система, в которой эти два средних совпадают, называется эргодической. В ней неважно, смотришь ты на толпу в один момент или на одного сквозь время, — ответ один. Система, в которой они расходятся, — неэргодической. И вот неуютная правда: огромная часть решений в реальной жизни происходит в неэргодических системах, а считаем мы их так, будто система эргодична. Берём среднее по ансамблю — EV — и прикладываем к своей единственной траектории, туда, где работает только среднее по времени.
У эргодичности неожиданно красивая родословная — она пришла не из экономики и не из теории вероятностей, а из физики газов.
В 1880-х Людвиг Больцман пытался понять, как описывать газ из мириад молекул, каждая из которых летает и сталкивается по своим законам. Считать каждую невозможно. Но можно схитрить: вместо того чтобы следить за одной молекулой во времени, рассмотреть мгновенный снимок всех молекул сразу и усреднить по нему. Больцман предположил, что для газа в равновесии это законно: за достаточно долгое время одна молекула побывает во всех возможных состояниях, и среднее по её пути совпадёт со средним по мгновенному снимку всего газа. Он сложил это слово из греческих ergon (работа, энергия) и hodos (путь) — «путь через все состояния»2.
В этом и суть эргодической гипотезы: система за время проходит все свои состояния, поэтому путь одного во времени эквивалентен снимку многих сразу. Для газа в сосуде это в основном верно — молекула и правда мечется по всему объёму, нигде не застревая навсегда.
В 1931 году Джордж Биркхоф доказал эргодическую теорему — точные условия, при которых среднее по времени гарантированно равно среднему по ансамблю. И там же выявилось условие, при котором равенство ломается: система не должна разваливаться на части, из которых нет выхода. Если в пространстве состояний есть область, куда можно войти и нельзя выйти, — система застревает, путь во времени больше не обходит всё, и два средних расходятся3. Запомни это условие про «вошёл и не вышел» — оно сейчас вернётся и окажется вопросом жизни и смерти, а не газовой динамики.
Откуда берётся расхождение в нашей монете? Из одной простой вещи: деньги — и почти всё важное в жизни — растут умножением, а не сложением.
Будь игра аддитивной — орёл +50 рублей, решка −40 рублей — всё было бы честно. Среднее по времени совпало бы со средним по ансамблю, система была бы эргодической, EV давал бы верный ответ: плюс пять рублей за бросок, играй смело. В аддитивном мире матожидание — царь, и оно право.
Но игра мультипликативна: не +50 рублей, а ×1.5. А в мире умножения симметрия ломается. Потерять 40% и затем выиграть 50% — это не «плюс-минус ноль», это ×0.6 × 1.5 = 0.9, минус десять процентов. Падение бьёт по тому, что осталось, а после падения осталось меньше — поэтому последующий рост отыгрывает от уменьшенной базы. Чтобы оправиться от потери 40%, нужно вырасти не на 40%, а на 67%. Умножение наказывает за просадки несимметрично, и эта несимметрия и разводит два средних.
Технически это разница между арифметическим и геометрическим средним. Арифметическое — (1.5 + 0.6) / 2 = 1.05, растёт. Геометрическое — √(1.5 × 0.6) ≈ 0.95, падает. Среднее по ансамблю живёт по арифметическому, среднее по времени — по геометрическому, и в мультипликативной игре геометрическое всегда меньше. Вот и весь механизм4.
Ансамблевое среднее растёт, потому что его вытягивает горстка везунчиков с длинной полосой орлов: их состояния улетают в небо и тянут сумму вверх. Но среднее «богатеет» за счёт того, что немногие получают почти всё, а большинство разоряется. Среднее по толпе растёт; типичный человек в толпе нищает. Когда тебе говорят «средняя доходность стратегии +5%» — очень часто это ровно такая картина: среднее красивое, медиана на нуле, и ты, скорее всего, не везунчик с правого края.
Есть и вторая причина расхождения, ещё жёстче первой. В мультипликативной игре существует состояние, из которого нет возврата: ноль. Умножь что угодно на ноль — будет ноль, и никакой будущий рост уже ничего не исправит. Разорение — это поглощающее состояние: войдя, остаёшься навсегда.
Вот здесь возвращается условие Биркхофа — «вошёл и не вышел». Цепь Маркова — это состояния и вероятности переходов между ними. Если в цепи есть достижимое поглощающее состояние, то на длинном горизонте ты попадёшь в него почти наверняка — и останешься. Разорение игрока — ровно такая цепь5. И связь прямая: система с достижимым поглощением не может быть эргодической, потому что время в ней течёт в одну сторону (к поглощению), а ансамбль усредняет туда-сюда, будто выход есть. EV считает так, словно из нуля можно вернуться усреднением. Из нуля не возвращаются.
Самый острый пример — не монета, а русская рулетка. Барабан на шесть гнёзд, один патрон, выстрел приносит, скажем, миллион долларов. Посчитай EV: пять шансов из шести получить миллион, один из шести — смерть. Если оценить жизнь в любую конечную сумму, матожидание выходит громадным положительным. EV говорит: играй. Но никакая сумма не стоит игры, в которой проигрыш — поглощающее состояние, потому что после него не будет ни следующего раунда, ни денег, ни тебя. Талеб приводит этот пример как лобовое опровержение EV-мышления: матожидание складывает вселенную, где ты получил миллион, со вселенной, где ты мёртв, и выдаёт бодрое среднее — но ты живёшь не среднее по вселенным, ты живёшь одну6.
Поэтому матожидание систематически и опасно врёт именно там, где есть риск разорения. И врёт оно тем сильнее, чем серьёзнее ставка, — то есть ровно в самых важных решениях.
Соблазнительно отмахнуться: монета, рулетка — искусственные игры. Но неэргодичность разлита по реальным решениям гораздо шире, чем кажется.
Предпринимательство. «Стартапы в среднем создают огромную ценность» — правда по ансамблю. Но конкретный основатель проходит одну траекторию, и если он вложил всё и прогорел, среднее по индустрии его не воскресит. Венчурные фонды живут по ансамблю (много ставок, неважно, что большинство умрёт), а основатель живёт по времени (одна ставка, одна жизнь). Поэтому фонду рационально то, что основателю — нет, и это не разница в смелости, а разница в эргодичности их положений.
Инвестиции. Историческая доходность рынка «в среднем 7% годовых» — ансамблевое утверждение. Твой личный результат зависит от одной последовательности — от того, не пришёлся ли обвал на момент, когда тебе нужно было выйти. Два инвестора с одинаковой средней доходностью, но разным порядком хороших и плохих лет, приходят к разным состояниям. Порядок не влияет на ансамблевое среднее и решает всё для среднего по времени.
Лекарства и риск. «Препарат в среднем продлевает жизнь» может скрывать, что он немного помогает многим и убивает немногих. Для популяции (ансамбль) среднее положительное. Для тебя (одна траектория) релевантен вопрос, не окажешься ли ты среди немногих, — потому что для тебя это поглощающее состояние.
ВВП и неравенство. Когда объявляют «экономика выросла на 3%», это рост ансамблевого среднего. Он совместим с тем, что у медианного человека доходы стоят или падают, а весь рост достался верхушке. Питерс показывает, что разрыв между «средним» благополучием и типичным — это во многом разрыв между ансамблевым и временным средним, встроенный в мультипликативную природу богатства, а не только вопрос политики7.
Узор везде один: кто-то усредняет по многим (фонд, страховая, государство, статистик) — и для него эргодическая логика честна. А кто-то идёт по одной дороге (основатель, пациент, ты) — и для него она смертельно обманчива. Беда начинается, когда советы, посчитанные для ансамбля, применяют к одной траектории.
Странно, что такую базовую вещь заметили поздно. Но история объясняет почему.
Начиная с фон Неймана и Моргенштерна (1947) мейнстрим-экономика построила теорию рационального выбора на ожидаемой полезности — по сути на ансамблевом усреднении. Рациональный агент по определению максимизирует EV (полезности). Эта рамка была так успешна и так математически удобна, что эргодическое допущение в ней просто растворилось: «среднее» молча понималось как ансамблевое, время из моделей выпало.
Когда люди систематически нарушали эту теорию, объяснение искали в психологии: Канеман и Тверски показали, что человек «иррационален» — боится потерь, искажает вероятности, ошибается предсказуемо. Это великая работа, но она оставляла EV-рамку нетронутой: теория верна, просто люди кривые.
Оле Питерс, физик из London Mathematical Laboratory, предложил третий путь. Что, если человек не иррационален, а EV-рамка просто отвечает не на тот вопрос? Избегание потерь, нежелание ставить всё на плюсовое матожидание, осторожность с риском разорения — это не баги психики, а оптимальное поведение для среднего по времени в неэргодическом мире. Не человек кривой — модель меряет не ту величину. Где Канеман видел искажение, Питерс видит правильный ответ на правильный вопрос, который EV не задаёт8.
Тут надо притормозить и быть точным, потому что вокруг эргодичности много горячего воздуха.
Во-первых, сама монета как случайный процесс — эргодична: частота орлов честно сходится к ½. Неэргодично здесь богатство, которым ты играешь, из-за мультипликативности. Путать эти два уровня — частая ошибка популяризаторов; неэргодична динамика твоего капитала, а не подбрасывание.
Во-вторых, многие экономисты справедливо возражают, что новизна преувеличена. То, к чему приходит Питерс, во многом совпадает с критерием Келли (1956) и логарифмической полезностью Бернулли (1738): максимизируй ожидаемый логарифм богатства — и ты максимизируешь рост по времени. Идея, что для мультипликативного роста надо брать геометрическое среднее, а не арифметическое, известна давно. Заслуга Питерса не в формуле, а в оптике: он объяснил, почему логарифм правильный, через различие двух средних, и показал, как глубоко ансамблевое допущение въелось в экономику9.
Иначе говоря: эргодичность — не отмена матожидания и не магическое новое знание. Это уточнение границ. EV прав в аддитивном или эргодическом мире и для того, кто усредняет по многим. Он врёт в мультипликативном неэргодическом мире для того, кто идёт по одной дороге. Знать, в каком ты мире, — и есть всё мастерство.
Из всего складываются три следствия — от жёсткого к тонкому.
Избегай поглощающих состояний любой ценой. Никакое матожидание не оправдывает ненулевой вероятности разорения, если ты повторяешь ставку и играешь вдолгую. Выживание — не одна из целей рядом с доходностью; это условие, при котором доходность вообще имеет смысл. До среднего надо дожить — а у того, кто обнулился, среднего не будет.
Думай мультипликативно и по времени. Спрашивай не «каков средний исход одной ставки», а «что станет с моей траекторией, если повторять это». Геометрический рост, а не арифметическое среднее. Именно отсюда растёт критерий Келли: он максимизирует логарифм богатства, то есть скорость роста по времени, и поэтому спасает от разорения там, где EV его не замечает. Размер ставки — не деталь, а главное: одна и та же плюсовая по EV ставка в правильном размере растит тебя, а в неправильном обнуляет10.
Различай эргодичное и неэргодичное. Разовая ставка, которая физически не может тебя обнулить, — почти эргодична: EV работает, считай смело и не трусь. Повторяющаяся ставка с риском разорения — неэргодична: EV врёт, считай по времени и береги основание. Большинство дорогих ошибок жизни — это применение эргодической логики («среднее плюсовое, играю») к неэргодической реальности («одна траектория, один ноль — и конец игры»).
Самое странное в эргодичности — что ансамблевое среднее не ошибка и не иллюзия. Оно настоящее. Те +5% за бросок реальны: их получает ансамбль, ими богатеет толпа-как-целое, их видит экономист, считающий рост. Просто это среднее принадлежит коллективу из тысячи параллельных игроков, а не тебе, идущему по одной дороге во времени. Ты не получишь его — не потому что не повезёт, а потому что оно адресовано не тебе. Оно посчитано для вселенной, в которой ты живёшь тысячу жизней одновременно. Ты живёшь одну.
Больцман придумал эргодичность, чтобы заменить невозможный путь одной молекулы удобным снимком всего газа. Для молекул это работает — они и правда мечутся по всему объёму, нигде не застревая. Беда человека в том, что у него есть состояния, в которых он застревает навсегда, — а значит, заменять его дорогу во времени снимком толпы нельзя. Мы — не молекулы идеального газа. У нас есть ноль, из которого не возвращаются.
Бернулли в 1738-м первым нащупал, что богатство надо мерить логарифмом. Питерс через триста лет объяснил, почему: логарифм — это и есть то, что превращает мультипликативную неэргодическую игру обратно в честную, где среднее по времени снова можно считать. Одна и та же поправка, найденная дважды, с разных сторон, тремя веками врозь.
Если совсем коротко: EV — это среднее по жизням, которых у тебя нет. У тебя есть одна. Считай её.
«не переходи реку, если она в среднем по колено.»
— приписывается Нассиму Талебу
- Риск против неизвестности.
- Эргодичность. Почему среднее вам не достанется.
- Чёрный лебедь. Почему редкое решает.
- Антихрупкость. Что делать с тем, чего не знаешь.