null
(D,D)
задача · теория игр
дилемма заключённого
prisoner's dilemma · рациональность каждого ведёт к худшему для всех
обозначение(D, D) — оба предают
определениеигра, где предательство выгоднее молчания при любом ходе соперника, но взаимное молчание лучше взаимного предательства для обоих
сформулировалМеррилл Флад и Мелвин Дрешер · 1950 · RAND; формулировку-историю придумал Альберт Такер
свойстваединственное равновесие Нэша — взаимное предательство · оно хуже кооперативного исхода для обоих · в повторённой игре кооперация может стать устойчивой
связаноравновесие Нэша · минимакс · теория игр · око за око

эссе · ~460 слов · 4 мин

Когда умные проигрывают вместе.

самая известная игра в мире. показывает, что «разумно для каждого» и «хорошо для всех» — разные вещи.

Двух подельников взяли и развели по камерам. Каждому предлагают сделку: сдай напарника. Расклад такой. Молчат оба — по году каждому (улик мало). Один сдаёт, другой молчит — стукач выходит на свободу, молчун получает десять лет. Сдают оба — по три года.

B молчит (C)B предаёт (D)
A молчит (C)−1, −1−10, 0
A предаёт (D)0, −10−3, −3 ← (D,D)

Теперь рассуждай за одного. Что бы ни делал напарник, тебе выгоднее предать. Если он молчит — предав, ты выходишь на свободу вместо года. Если он предаёт — предав, ты получаешь три года вместо десяти. Предательство выигрывает в обоих случаях. Так же думает второй. Оба предают — оба получают по три года. Хотя, промолчав, отделались бы годом.

Вот в чём укус: каждый поступил безупречно рационально, и вместе они пришли к исходу, который хуже для обоих. Это не ошибка игроков. Предать — действительно лучший индивидуальный ход. Плохой исход встроен в саму структуру игры.

Умные, эгоистичные и совершенно рациональные участники способны дружно прийти туда, куда никто из них не хотел.

На языке теории игр (D, D) — взаимное предательство — это единственное равновесие Нэша1. Точка, из которой ни одному невыгодно уходить в одиночку: если ты вдруг замолчишь, а напарник продолжит предавать, тебе станет только хуже. Стабильно — и при этом коллективно провально. Дилемма заключённого стала каноническим доказательством того, что равновесие и оптимум — разные вещи.

И она повсюду, как только присмотришься. Гонка вооружений: обеим странам лучше разоружиться, но каждой по отдельности выгоднее вооружаться — и обе вооружаются. Реклама конкурентов: всем дешевле не тратиться, но каждый боится уступить — и все жгут бюджеты. Переэксплуатация общего ресурса, допинг в спорте, ценовые войны — всюду один скелет: индивидуальная рациональность выедает общее благо.

Но есть выход, и он красив. Всё меняется, если игра не одна, а повторяется много раз и игроки встретятся снова. Тогда предательство сегодня аукнется местью завтра, и кооперация становится рационально устойчивой. В 1980-м Роберт Аксельрод устроил турнир компьютерных стратегий для повторённой дилеммы. Победила самая простая — «око за око»: начни с доверия, дальше повторяй последний ход соперника2. Дружелюбная (не предаёт первой), но не наивная (мстит сразу), и отходчивая (прощает после возврата к кооперации). Будущее, в котором придётся встретиться снова, превращает врагов в партнёров — без всякого альтруизма, на чистой математике.

Это и есть мост к покеру и к жизни. Разовая сделка с незнакомцем и многолетние отношения — структурно разные игры, даже если ставки одинаковы. В первой рационально предать. Во второй — сотрудничать. Тень будущего меняет всё.