⊞
объект · справка · §10
стратегии повторяющейся игры
каталог · от классики взаимности до скрытого слоя
| тип | каталог · 20 стратегий · повторяющаяся дилемма заключённого |
| семейства | взаимные · каратели · наивные · прощупыватели · ZD · современные · вне правил |
| связано | эволюция кооперации · математика предательства · дилемма заключённого |
объект · справка · каталог · ~1200 слов · 8 мин
Сразу оговорка, без которой список врёт: единого «лучшего» нет. Кто победит, зависит от среды — длины тени будущего, уровня шума, состава поля, структуры популяции. Вымогатель царит в дуэли и нищает в эволюции; око за око берёт турнир и не выигрывает ни одной схватки. Поэтому ниже — не строгий рейтинг, а каталог по семействам, от самых надёжных к самым специальным. О том, при каких условиях кто выигрывает, — в эссе «условия кооперации».
Обозначения: **память** — на сколько прошлых ходов смотрит правило.
// взаимные · ядро кооперации
1
око за око
память 1 · Рапопорт, 1980
2
великодушное око за око
память 1 · Новак–Зигмунд, 1992
3
око за два ока
память 2 · Аксельрод, 1980
4
Pavlov
память 1 · Новак–Зигмунд, 1993
5
раскаивающееся око за око
память + «репутация» · Бойд, 1989
6
постепенный
полная история · Бофис–Делаэ–Матьё, 1996
// каратели · память без прощения
7
спусковой крючок
полная история · Аксельрод, 1980
8
строгое/мягкое большинство
полная история
// наивные · базовая линия
9
всегда мир
память 0
10
всегда бей
память 0
11
случайный
память 0
// прощупыватели · разведка и эксплуатация
12
прощупыватель
память 1+
13
хитрое око за око
память 1 · Аксельрод, 1980
14
моделирующий
полная история · Аксельрод, 1980
// скрытый слой · zero-determinant
15
великодушная ZD
память 1 · Стюарт–Плоткин, 2012
16
вымогатель
память 1 · Пресс–Дайсон, 2012
// современные · выращенные
17
обученные RL/эволюцией
Харпер и др., 2017
18
омега-око-за-око
память + счётчики
19
адаптивное око за око
Держит непрерывную оценку «настроения» соперника и реагирует плавно, без резких качелей кооперация/предательство.
// вне правил · взлом турнира
20
господин/раб
Десятки программ узнают своих по «рукопожатию», затем делятся на жертв и эксплуататоров. Формально свергли око за око — но обходом запрета на сговор, а не лучшей стратегией.
на полях
эссе: эволюция кооперации · условия кооперации · математика предательства
объекты: дилемма заключённого · равновесие нэша · Pavlov · zero-determinant стратегии