null
визуал · №026
турниры Аксельрода
1980–1981 · как кооперация победила предательство. два компьютерных турнира которые изменили теорию игр.

«Как возникает кооперация между эгоистичными агентами если нет никакой внешней власти которая принуждает к честности?»
1979 год. Роберт Аксельрод — профессор политологии Мичиганского университета — задаёт этот вопрос. Холодная война. Гонка вооружений. Ядерный тупик. Он решает найти ответ через компьютерный эксперимент. Пригласить учёных. Устроить турнир. И посмотреть какая стратегия выживет.
оппонент: C оппонент: D
ты: C 3 / 3 0 / 5
ты: D 5 / 0 1 / 1
200 раундов · round-robin · каждый против каждого
C = cooperate · D = defect
NE = оба предают (1/1) · красная рамка
Парето-оптимум = оба кооперируют (3/3) · зелёный фон
бенчмарк взаимной кооперации = 600 очков за 200 раундов
Аксельрод разослал приглашения специалистам по теории игр. 14 FORTRAN-программ пришли по почте — из психологии, экономики, политологии, математики, социологии. Его ассистент Джефф Пиннонен написал код турнира. Программы отнесли в вычислительный центр. Ждали overnight пока мэйнфрейм обрабатывал данные.
# стратегия автор дисциплина
1 Tit-for-Tat Анатолий Рапопорт математика/психология · Торонто · 504.5
2Tideman and ChieruzziТ. Тайдман и П. Кьеруцциполитология · Корнелл
3NydeggerРуди Нидеггерпсихология
4GrofmanБернард Грофманполитология
5ShubikМартин Шубикэкономика · Йель
6Stein and RapoportШтейн и А. Рапопортматематика
7Grudger (Grim Trigger)Джеймс Фридманэкономика
8DavisМортон Дэвисматематика
9GraaskampДжим Граскамп
10DowningЛесли Даунингпсихология
11FeldСкотт Фелдсоциология
12JossИоганн Йоссматематика
13TullockГордон Таллокэкономика/политология
14Anonymousнеизвестен
RANDOMАксельрод (baseline)
* TfT отправлена единственной 4-строчной программой. все сложные стратегии — ниже в рейтинге.
1 Tit-for-Tat 504.5
2 Tideman & Chieruzzi 500.4
3 Nydegger 499.4
4 Grofman 487.5
5 Shubik 482.7
6 Stein & Rapoport 479.7
Always Defect (худший) 401.2
отрыв TfT от второго места: 4.1 очка
бенчмарк взаимной кооперации: 600 очков
бенчмарк взаимной дефекции: 200 очков
1
добрая
никогда не предаёт первой. не провоцирует эскалацию без причины.
2
наказывающая
немедленно отвечает на предательство. нельзя эксплуатировать безнаказанно.
3
прощающая
после наказания возвращается к кооперации. не застревает в бесконечной войне.
4
прозрачная
оппонент легко понимает логику. можно выстроить взаимную кооперацию.
«самая короткая программа турнира оказалась самой успешной. сложность не помогла никому.» — Роберт Аксельрод · анализ турнира · 1980
// участников
62
+48 от первого
// стран
6
США · Канада · Британия · Норвегия · Швейцария · Н. Зеландия
// победитель
TfT
снова Рапопорт
// публикация
Science
1981 с У. Гамильтоном
Аксельрод разместил объявления в журналах для любителей компьютеров — Personal Computing и других. Он открыто сообщил что TfT победил в первом турнире и объяснил почему. Поставил цель: побить TfT. Среди 62 участников — профессора, студенты и 10-летний вундеркинд. Уильям Гамильтон — эволюционный биолог, основатель теории инклюзивной приспособленности — присоединился к анализу. Результат: TfT победил снова. Вместе они опубликовали работу в Science. Это сделало результаты известными всему миру.
Второй турнир отличался форматом — вместо фиксированных 200 раундов каждый матч заканчивался с вероятностью 0.00346 в каждом раунде. Это делало горизонт неизвестным — ближе к реальным взаимодействиям.
код автор примечание
K31RGail GrisellGoByMajority стратегия
K32RCharles Kluepfel
K33RHarold Rabbie
K34RJames W FriedmanGrudger — участник обоих турниров
K35RAbraham Getzler
K36RRoger Hotz
K37RGeorge Lefevre
K38RNelson Weiderman
K39RTom Almy
K40RRobert Adams
K41RHerb Weiner
K42ROtto Borufsen
K43RR D Anderson
K44RWilliam Adams
K67RCraig FeathersTranquilizer стратегия
K68RDanny ChampionChampion стратегия
K69RGraham EatherleyEatherley стратегия
Anatol RapoportTit-for-Tat · победитель · единственный кто переотправил ту же стратегию
показаны 18 из 62 участников · остальные ~44 — читатели журналов для компьютерных энтузиастов (Personal Computing и др.) включая 10-летнего участника чьё имя неизвестно
После турниров Аксельрод запустил симуляцию. Стратегии «размножались» пропорционально приспособленности. Через 1000 поколений TfT лидировала с темпом роста 0.05%/поколение. Always Defect вымирала — когда кооператоры исчезали, ей не с кем было взаимодействовать кроме себя.
// поколений 40
// старт TfT % 20%
кооперация возможна без центральной власти. три необходимых условия:
  1. игра повторяется — есть завтра
  2. игроки ценят будущее — «тень будущего» достаточно длинна
  3. игроки узнают друг друга — репутация работает
предательство оптимально один раз. кооперация оптимальна всегда — если есть завтра.
¹ Axelrod R. · «Effective Choice in the Prisoner's Dilemma» · Journal of Conflict Resolution · 24(1) · 1980
² Axelrod R. · «More Effective Choice in the Prisoner's Dilemma» · Journal of Conflict Resolution · 24(3) · 1980
³ Axelrod R., Hamilton W.D. · «The Evolution of Cooperation» · Science · 211 · 1981
⁴ Имена участников: Axelrod Python Library документация · axelrod.readthedocs.io