null
объект · справка · §10
стратегии повторяющейся игры
каталог · от классики взаимности до скрытого слоя
типкаталог · 20 стратегий · повторяющаяся дилемма заключённого
семействавзаимные · каратели · наивные · прощупыватели · ZD · современные · вне правил
связаноэволюция кооперации · математика предательства · дилемма заключённого

объект · справка · каталог · ~1200 слов · 8 мин

Сразу оговорка, без которой список врёт: единого «лучшего» нет. Кто победит, зависит от среды — длины тени будущего, уровня шума, состава поля, структуры популяции. Вымогатель царит в дуэли и нищает в эволюции; око за око берёт турнир и не выигрывает ни одной схватки. Поэтому ниже — не строгий рейтинг, а каталог по семействам, от самых надёжных к самым специальным. О том, при каких условиях кто выигрывает, — в эссе «условия кооперации».

Обозначения: **память** — на сколько прошлых ходов смотрит правило.

// взаимные · ядро кооперации
1
око за око (tit-for-tat)
память 1 · Рапопорт, 1980
2
великодушное око за око (generous tit-for-tat)
память 1 · Новак–Зигмунд, 1992
3
око за два ока (tit-for-two-tats)
память 2 · Аксельрод, 1980
4
Pavlov (win-stay, lose-shift)
память 1 · Новак–Зигмунд, 1993
5
раскаивающееся око за око (contrite tit-for-tat)
память + «репутация» · Бойд, 1989
6
постепенный (gradual)
полная история · Бофис–Делаэ–Матьё, 1996
// каратели · память без прощения
7
спусковой крючок (grim trigger / Friedman)
полная история · Аксельрод, 1980
8
строгое/мягкое большинство (hard/soft majority)
полная история
// наивные · базовая линия
9
всегда мир (ALLC)
память 0
10
всегда бей (ALLD)
память 0
11
случайный (random)
память 0
// прощупыватели · разведка и эксплуатация
12
прощупыватель (prober)
память 1+
13
хитрое око за око (Joss)
память 1 · Аксельрод, 1980
14
моделирующий (Downing / outcome-maximization)
полная история · Аксельрод, 1980
// скрытый слой · zero-determinant
15
великодушная ZD (ZDGTFT-2)
память 1 · Стюарт–Плоткин, 2012
16
вымогатель (Extort-2)
память 1 · Пресс–Дайсон, 2012
// современные · выращенные
17
обученные RL/эволюцией · переменная память
Харпер и др., 2017
18
омега-око-за-око (Omega TFT)
память + счётчики
19
адаптивное око за око (adaptive TFT) · скользящая оценка · Дзафестас, 2000
Держит непрерывную оценку «настроения» соперника и реагирует плавно, без резких качелей кооперация/предательство.
// вне правил · взлом турнира
20
господин/раб (Southampton handshake) · сговор · Кендалл/Дженнингс, 2004
Десятки программ узнают своих по «рукопожатию», затем делятся на жертв и эксплуататоров. Формально свергли око за око — но обходом запрета на сговор, а не лучшей стратегией.