zero-determinant стратегии — null/objects/game-theory

объект · справка · §10

zero-determinant стратегии

скрытый слой повторяющейся игры — и почему власть в ней оборачивается щедростью

тип	zero-determinant · memory-one · линейная связь выигрышей
открыли	Уильям Пресс · Фримен Дайсон · PNAS, 2012
связано	эволюция кооперации · условия кооперации · каталог стратегий IPD

объект · справка · ~500 слов · 4 мин

// что это

Открыты Уильямом Прессом и Фрименом Дайсоном в 2012-м^[1]. Главный результат неожиданный: игрок, помнящий всего один прошлый ход, способен в одиночку навязать жёсткую линейную связь между своим и чужим средним выигрышем — что бы соперник ни предпринимал. Не «переиграть» его ход за ходом, а заранее задать уравнение, которому подчинятся итоговые очки обоих. Сила не в реакции, а в навязанном законе.

// два лица

Вымогатель (extortion). Фиксирует, что собственный выигрыш всегда превышает чужой в заданной пропорции. Рациональный соперник, повышая своё, поневоле повышает и твоё — и вынужден кооперировать, обогащая вымогателя сверх всякой взаимности.

Великодушная ZD (generous). Зеркальна вымогателю: гарантирует сопернику долю не меньше твоей. Делится излишком там, где вымогатель его отнимает.

// эволюционный поворот

Вымогательство непобедимо в дуэли против одинокого рационального соперника — но в популяции разоряет само себя: вымогателю не с кого получать сверхприбыль, кроме других вымогателей, а друг на друге они лишь беднеют. Когда Стюарт и Плоткин перепрогнали турнир Аксельрода с добавлением ZD-стратегий, великодушная ZDGTFT-2 дала наивысший средний балл, а вымогательский Extort-2 оказался почти в самом низу^[2]. Великодушные ZD эволюционно устойчивы, вымогательские — нет. Даже найдя в игре рычаг абсолютной власти, математика выводит к тому же, что и весь остальной сюжет кооперации: щедрость живёт дольше жадности.

// связь с око за око

Само око за око оказывается пограничным случаем ZD — стратегией, которая навязывает равенство выигрышей обоих игроков (нулевое «превосходство»). То есть классика взаимности всё это время сидела внутри более широкого класса, открытого лишь тридцать лет спустя.

на полях

эссе: эволюция кооперации · условия кооперации

объекты: стратегии повторяющейся игры · дилемма заключённого · равновесие нэша

[1]W. Press, F. Dyson. «Iterated Prisoner's Dilemma contains strategies that dominate any evolutionary opponent». PNAS (2012). Введение класса zero-determinant (ZD) стратегий для memory-one игроков.

[2]A. Stewart, J. Plotkin (2012): переигровка турнира Аксельрода с ZD-стратегиями. Великодушная ZDGTFT-2 — наивысший средний балл; вымогательский Extort-2 — почти худший. Эволюционная устойчивость великодушных ZD и неустойчивость вымогательских.