xG, или счёт врёт.
Счёт на табло — правда, в которую трудно не верить. Но есть метрика, что регулярно с ним спорит и чаще оказывается права на дистанции: xG, ожидаемые голы — футбольное имя обычного матожидания.
| тема | футбол · expected goals · матожидание · resulting · дисперсия |
| читать | ~7 минут |
| связано | андердоги · EV · хорошие решения · закон малых чисел · дисперсия |
Два нападающих за сезон бьют одинаково часто. Первый забил двадцать, второй — десять. Кто лучше? Очевидный ответ может быть неверным: вдруг второй создавал такие же моменты, но ему не везло у ворот? Счёт этого не различает. xG — различает: эта метрика измеряет не голы, а их качество — насколько хорош был момент, а не чем он кончился.
Идея проста. Каждому удару модель присваивает вероятность стать голом — по тому, как завершались тысячи похожих ударов: с этой дистанции, под этим углом, ногой или головой, после прострела или в контратаке3. Сумма этих вероятностей за матч и есть ожидаемые голы. Удар из вратарской — скажем, 0.4 гола, дальний по центру — 0.03. Команда, наигравшая на 2.5 xG и забившая ноль, не была плоха — ей не повезло у ворот. То есть xG — буквально математическое ожидание, перенесённое на газон: среднее по многим повторениям одного момента.
Откуда метрика. xG ввёл в 2012 году аналитик Сэм Грин из компании Opta — вдохновившись моделями из американского спорта1. Идея витала и раньше2, но именно Грин дал ей имя и показал силу на живом примере. В сезоне 2011/12 он указал: Луис Суарес забивает мало не потому, что слаб, а потому что невезуч — моменты у него отличные4. Счёт говорил «посредственный сезон», xG говорил «отличная игра, плохая удача». В следующие два сезона Суарес забил 23 и 31. Процесс предсказал будущее точнее, чем результат.
Почему ей верят. Голы — это процесс плюс удача; xG — процесс без неё. На коротком отрезке они расходятся (та самая дисперсия), на дистанции сходятся (закон больших чисел): за один матч счёт может наврать, за сезон xG почти всегда ближе к правде о команде, чем табло. Поэтому тренеры и аналитики смотрят на xG, а не только на счёт — он устойчивее и предсказательнее, потому что меньше засорён шумом. С сезона 2017/18 его показывают даже в эфире BBC5.
Счёт говорит, что случилось. xG говорит, что должно было случиться. Разница между ними — это удача.
Границы. У метрики есть честные пределы. xG — модель, а не истина: разные модели расходятся в оценке одного удара, и xG отдельного матча сам по себе — малая выборка, по которой нельзя судить уверенно6. Он не знает про счёт на табло, давление, усталость. xG — не приговор, а поправка: он не отменяет счёт, а напоминает, сколько в нём случайного.
И вот чем xG ценен за пределами футбола. Это resulting наоборот: вместо «оценим решение по тому, чем оно кончилось» — «оценим по качеству самого момента». Ровно то, что в покере зовут игрой от EV, а в жизни — судить процесс, а не исход. xG — редкий случай, когда целый спорт согласился измерять не результат, а решение. Стоит поучиться.