null
σ*
game-theory · №001
равновесие Нэша
Nash equilibrium · профиль стратегий, от которого невыгодно отклоняться в одиночку
обозначениеσ* или (s₁*, …, sₙ*)
определениепрофиль стратегий, в котором ни один игрок не может увеличить свой выигрыш, изменив только свою стратегию
ввёлДжон Нэш · 1950 · «Equilibrium Points in N-Person Games»
свойствасуществует для любой конечной игры (в смешанных стратегиях) · для игр двух лиц с нулевой суммой совпадает с минимаксом
связаноминимакс · дилемма заключённого · смешанная стратегия · GTO

эссе · ~480 слов · 4 мин

Точка, из которой невыгодно уходить.

равновесие — это не лучший исход. это исход, который никто не станет менять в одиночку.

Равновесие Нэша — набор стратегий всех игроков, при котором ни одному не выгодно менять свою стратегию, пока остальные не меняют свои. Каждый играет лучший ответ на то, что делают другие. Поэтому никто не хочет двигаться — и система застывает.

Классический пример — дилемма заключённого. Двое могут молчать или предать. Если молчат оба — обоим хорошо (по году тюрьмы). Но каждому по отдельности выгоднее предать: что бы ни сделал второй, предательство даёт меньший срок лично тебе. Поэтому единственное равновесие — оба предают, и оба получают по три года. Хуже, чем если бы молчали.

Это и есть главная мысль про равновесие: оно стабильно, но не обязательно хорошо. Точка, из которой невыгодно уходить поодиночке, может быть плохой для всех сразу. «Стабильное» и «оптимальное» — разные слова.

Нэш описал не то, как игроки должны играть. Он описал, где они неизбежно застрянут.

Нэш в 1950 году доказал то, что сделало понятие универсальным: в любой конечной игре существует хотя бы одно равновесие — если разрешить смешанные стратегии, то есть игру по вероятностям, а не по одному фиксированному ходу1. Доказательство опиралось на теорему о неподвижной точке: всегда есть конфигурация, которая отображается сама в себя. Это превратило теорию игр из набора частных случаев в общую науку и принесло Нэшу Нобелевскую премию по экономике в 1994 году2.

Частный случай был известен раньше. Для антагонистических игр двух лиц — где выигрыш одного есть проигрыш другого — равновесие совпадает с минимаксом фон Неймана (1928): минимизируй свой максимально возможный проигрыш3. Нэш обобщил это на любое число игроков и на игры, где интересы не строго противоположны, а частично совпадают.

В покере равновесие Нэша носит имя GTO — game theory optimal. Игрок, играющий равновесие, неуязвим: его нельзя обыграть на дистанции, что бы ни делал соперник. Но ровно поэтому он и не максимизирует прибыль против слабого соперника — равновесие защищает, а не атакует. Чтобы выжать максимум, приходится сознательно уходить из равновесия и становиться уязвимым. Этот размен — отдельная история.

За пределами игр равновесие Нэша описывает любую устойчивую конкурентную ситуацию, где односторонний шаг невыгоден: ценовые войны (никто не поднимает цену первым), гонку вооружений (никто не разоружается первым), переполненные дороги (никто не выигрывает, сменив маршрут в одиночку). Везде, где много участников оптимизируют каждый своё, система сползает в равновесие — и оно часто хуже того, чего можно было бы достичь сообща.