- V (карты)
- «ценность» карты для игрока — сколько монет даст карта своему обладателю до конца партии. У каждой карты своя V, и она может немного отличаться у разных игроков (асимметрия).
- C (компенсация)
- сколько монет получает проигравший аукцион игрок за каждую единицу своего диска. У каждой карты своя C — от 0.5 (уголь) до 3.5 (нефть).
- k (номинал диска)
- значение диска игрока: 1, 2, 3 или 4. У каждого игрока 4 диска. Чем больше k, тем выше шанс выиграть карту в аукционе, но и тем больше компенсация при проигрыше (C × k).
- P(победа)
- вероятность выиграть карту своим диском k. Зависит от того, есть ли на карте более старшие диски от соперников. Для k = 4 без старших соперников ≈ 0.85, для k = 1 ≈ 0.2.
- EV (ожидаемая ценность)
- математическое ожидание дохода от хода:
P(победа) × V + P(проигрыш) × C × k. Учитывает оба сценария — победу и компенсацию. Балансированная стратегия выбирает ход с максимальной EV.
- зазор #1 vs #2
- разница между оценкой лучшего хода и второго лучшего. Большой зазор означает уверенность алгоритма; маленький — что выбор «на грани», и в чуть других условиях стратегия могла бы выбрать иначе.
- σ (сигма)
- стандартное отклонение дохода игрока по 500 фоновым партиям. Чем больше σ, тем больше разброс возможных исходов. В песочнице используется для оценки «удачи»: 1σ — норма, +2σ — очень удачно, −2σ — катастрофа.
- прогноз ± σ
- матожидание дохода игрока с учётом дисперсии. «60 ± 12 $» означает: в среднем игрок зарабатывает 60, и большинство партий укладывается в коридор 48–72 $.
- Q1, Q3 (квартили)
- значения, ниже которых лежат 25 % и 75 % партий соответственно. Между Q1 и Q3 — «средние 50 %» результатов. На боксплоте это цветной прямоугольник.
- медиана
- среднее значение в отсортированном списке — белая линия в середине боксплота. Половина партий даёт больше, половина — меньше. Устойчивее к выбросам, чем среднее арифметическое.
- стратегии
- четыре алгоритма выбора хода:
жадная (Ж) — оценивает только V карты, игнорирует диск;
балансированная (Б) — считает EV, учитывает риск проигрыша;
компенсаторная (К) — оценивает только C × k, игнорирует ценность карты;
случайная — выбирает любой допустимый ход.