σ* — null/objects/game-theory

σ*

game-theory · №001

равновесие Нэша

Nash equilibrium · профиль стратегий, от которого невыгодно отклоняться в одиночку

обозначение	σ* или (s₁, …, sₙ)
определение	профиль стратегий, в котором ни один игрок не может увеличить свой выигрыш, изменив только свою стратегию
ввёл	Джон Нэш · 1950 · «Equilibrium Points in N-Person Games»
свойства	существует для любой конечной игры (в смешанных стратегиях) · для игр двух лиц с нулевой суммой совпадает с минимаксом
связано	минимакс · дилемма заключённого · смешанная стратегия · GTO

эссе · ~480 слов · 4 мин

Точка, из которой невыгодно уходить.

равновесие — это не лучший исход. это исход, который никто не станет менять в одиночку.

Равновесие Нэша — набор стратегий всех игроков, при котором ни одному не выгодно менять свою стратегию, пока остальные не меняют свои. Каждый играет лучший ответ на то, что делают другие. Поэтому никто не хочет двигаться — и система застывает.

Классический пример — дилемма заключённого. Двое могут молчать или предать. Если молчат оба — обоим хорошо (по году тюрьмы). Но каждому по отдельности выгоднее предать: что бы ни сделал второй, предательство даёт меньший срок лично тебе. Поэтому единственное равновесие — оба предают, и оба получают по три года. Хуже, чем если бы молчали.

Это и есть главная мысль про равновесие: оно стабильно, но не обязательно хорошо. Точка, из которой невыгодно уходить поодиночке, может быть плохой для всех сразу. «Стабильное» и «оптимальное» — разные слова.

Нэш описал не то, как игроки должны играть. Он описал, где они неизбежно застрянут.

Нэш в 1950 году доказал то, что сделало понятие универсальным: в любой конечной игре существует хотя бы одно равновесие — если разрешить смешанные стратегии, то есть игру по вероятностям, а не по одному фиксированному ходу1. Доказательство опиралось на теорему о неподвижной точке: всегда есть конфигурация, которая отображается сама в себя. Это превратило теорию игр из набора частных случаев в общую науку и принесло Нэшу Нобелевскую премию по экономике в 1994 году2.

Частный случай был известен раньше. Для антагонистических игр двух лиц — где выигрыш одного есть проигрыш другого — равновесие совпадает с минимаксом фон Неймана (1928): минимизируй свой максимально возможный проигрыш3. Нэш обобщил это на любое число игроков и на игры, где интересы не строго противоположны, а частично совпадают.

В покере равновесие Нэша носит имя GTO — game theory optimal. Игрок, играющий равновесие, неуязвим: его нельзя обыграть на дистанции, что бы ни делал соперник. Но ровно поэтому он и не максимизирует прибыль против слабого соперника — равновесие защищает, а не атакует. Чтобы выжать максимум, приходится сознательно уходить из равновесия и становиться уязвимым. Этот размен — отдельная история.

За пределами игр равновесие Нэша описывает любую устойчивую конкурентную ситуацию, где односторонний шаг невыгоден: ценовые войны (никто не поднимает цену первым), гонку вооружений (никто не разоружается первым), переполненные дороги (никто не выигрывает, сменив маршрут в одиночку). Везде, где много участников оптимизируют каждый своё, система сползает в равновесие — и оно часто хуже того, чего можно было бы достичь сообща.

[1] John Nash · «Equilibrium Points in N-Person Games» · Proceedings of the National Academy of Sciences · 1950. Доказательство существования через теорему о неподвижной точке (Какутани).

[2] Нобелевская премия по экономике 1994 — Нэш, Харсаньи, Зельтен — за анализ равновесий в теории некооперативных игр.

[3] John von Neumann · теорема о минимаксе · 1928. Равновесие для антагонистических игр двух лиц — частный случай равновесия Нэша.