null
max−min
game-theory · №002
теорема о минимаксе
minimax · минимизируй свой максимально возможный проигрыш
обозначениеmax min = min max
определениев антагонистической игре двух лиц существует пара стратегий, гарантирующих каждому наилучший из худших исходов; величина этой гарантии для обоих совпадает
ввёлДжон фон Нейман · 1928 · «Zur Theorie der Gesellschaftsspiele»
свойстваверна для конечных игр двух лиц с нулевой суммой · в смешанных стратегиях минимум всегда достигается · частный случай равновесия Нэша
связаноравновесие Нэша · смешанная стратегия · дилемма заключённого · GTO

эссе · ~470 слов · 4 мин

Лучший из худших исходов.

защитная стратегия: не «как выиграть больше», а «как сделать так, чтобы худшее было не так плохо».

Минимакс — про игру, где интересы строго противоположны: что выигрывает один, ровно то проигрывает другой. Покер один на один, шахматы, делёж — антагонистические игры с нулевой суммой. В такой игре фон Нейман задал вопрос наоборот: не «какой ход принесёт максимум», а «какой ход гарантирует, что мой максимальный возможный проигрыш будет наименьшим».

Логика такая. Для каждой своей стратегии посмотри на худшее, что может случиться, если соперник ответит идеально против тебя. Получишь набор «худших исходов» — по одному на каждую твою стратегию. Минимакс говорит: выбери ту стратегию, у которой худший исход наименее плох. Ты не гонишься за лучшим — ты страхуешься от наихудшего.

Удивительное в теореме фон Неймана (1928) вот что: в антагонистической игре двух лиц эта осторожная, оборонительная величина для одного игрока в точности равна такой же осторожной величине для другого1. Максимум из минимумов одного равен минимуму из максимумов другого: max min = min max. Есть единственное число — цена игры — и пара стратегий, которые её гарантируют обоим. Точка, где обе обороны встречаются.

Рандомизация — не трюк, а математическая необходимость. В чистых стратегиях седловой точки может не быть; в смешанных она существует всегда.

Но есть тонкость, без которой теорема не работает. Если разрешены только чистые ходы (всегда делай одно и то же), такой точки может не быть. Она появляется, только если разрешить смешанные стратегии — играть по вероятностям, рандомизируя ходы. Камень-ножницы-бумага: любой предсказуемый выбор бьётся, а вот «каждое с вероятностью 1/3» нельзя проэксплуатировать. Это и есть минимаксная стратегия игры, и существует она только в смешанном виде2.

Через 22 года Джон Нэш обобщил это на любое число игроков и на игры, где интересы не строго противоположны. Равновесие Нэша — потомок минимакса; а для антагонистических игр двух лиц они совпадают3. Минимакс — это теория игр в зачаточной, самой чистой форме: два врага, ноль доверия, оборона как оптимум.

В покере минимакс — это душа GTO. Стратегия равновесия не пытается обыграть соперника — она гарантирует, что соперник не обыграет тебя, как бы хорошо ни играл. Лучший из худших исходов: ты неуязвим, но и не максимизируешь против слабого. Поэтому профи, садясь против сильного незнакомца, играет минимакс (защита), а против слабого — отклоняется (атака).

И тот же скелет — далеко за играми. «Минимизируй максимальный убыток» — это робастная оптимизация в инженерии, худший сценарий в риск-менеджменте, антифрод, дизайн систем, которые должны держать удар при любом поведении среды. Везде, где нельзя предположить, что противник или мир будут добры, минимакс отвечает: готовься к худшему ответу и сделай его терпимым.

Фон Нейман искал, как не проиграть. Получил математику гарантированной безопасности — и с неё началась вся теория игр.