визуал · №015
закон Бенфорда
первые цифры чисел в «природных» данных распределены не равномерно. цифра 1 встречается в 6 раз чаще цифры 9.
данные
набор
фибоначчи
— чисел
отклонение от закона
—
—
формула
P(d) = log₁₀(1 + 1/d)
P(1) ≈ 30.1% · P(2) ≈ 17.6% · P(3) ≈ 12.5% · … · P(9) ≈ 4.6%. Сумма = 1.
Закон выводится из инвариантности относительно смены единиц: распределение должно быть одинаковым в метрах и в милях. Единственное масштабно-инвариантное распределение для первой цифры — логарифмическое.
где работает
данные, охватывающие несколько порядков: численность населения, длины рек, площади стран, физические константы, биржевые цены, расходы из бухгалтерских отчётов.
используется в форензическом аудите: реальные транзакции следуют Бенфорду, выдуманные — нет. Этот метод принимают суды США как косвенное доказательство фальсификации.