Исчерпывающее руководство по шахматным рейтингам.

Проф. Марк Е. Гликман

Математический факультет

Бостонского Университета

111 Cummington St.

Boston, MA 02215

mg@math.bu.edu

Введение.

Теория современной рейтинговой системы, часто называемая в честь ее создателя системой Эло, была разработана в конце пятидесятых годов, но Интернациональная Шахматная Федерация (ФИДЕ) приняла ее к использованию лишь в 1970, в дальнейшем различные ее модификации взяли на вооружение многочисленные национальные шахматные федерации. Сегодня невозможно представить себе шахматный турнир без этой рейтинговой системы.

Системы шахматных рейтингов имеют несколько практических применений. Для определения пар на турнире директор турнира должен руководствоваться некими идеями, какие из игроков являются наиболее вероятными кандидатами на победу, и поэтому он должен избегать их встречи на ранних стадиях турнира. Рейтинги также используются для разбиения турниров по категориям и распределения призов. Рейтинги также могут быть использованы как квалификационная система для элитных турниров; приглашения принять участие в закрытых чемпионатах США или для отбора в олимпийскую команду США, основанную частично на рейтингах игроков Американской Шахматной Федерации (ЮСКФ). Современные "титульные" системы, используемые некоторыми шахматными федерациями, основывают свои титульные квалификации на средней силе участников турнира, измеряемой по их рейтингам. Но возможно самым полезным услугой рейтинговой системы является то, что она позволяет соперникам на всех уровнях отслеживать свой рост мастерства.

Первая шахматная рейтинговая система, вычислявшая численные рейтинги, была система Инго, разработанная Антоном Хесслингером в 1948 году в ФРГ, и названная так в честь его родного города Ингольштадт. В последующие 10 лет различные формы этой системы были использованы шахматными учреждениями, включая версии, разработанные в середине 50-х Кеном Харкнессом для ЮСКФ и Ричардом Кларком для Британской Шахматной Федерации. Эти системы учитывали частоту побед и уровень оппонента. Хотя системы, основанные на Инго, были очень популярны в 50-х, поскольку рейтинги, полученные на их основе, были логичны, они имели слабое статистическое обоснование. Фактически в системе Харкнесса игрок мог проиграть все игры на турнире и все равно набрать рейтинговые очки. Это и другие недочеты Хакрнессовской системы привели к принятию в США в 1960 году системы ЭЛО. [1]

[1] Первое описание системы появилось в статье " New USCF Rating System", Chess Life, June, 1961, 160-161.

В рейтинговой системе ЭЛО каждому игроку присваивается числовой рейтинг, основанный на выступлениях в шахматных соревнованиях. Рейтинг - это число, лежащее обычно между 0 и 3000, со временем меняющееся строго в зависимости от исхода игр на турнирах. Когда два игрока встречаются, рейтинговая система предсказывает, что тот, у кого выше рейтинг, будет побеждать чаще того, у кого рейтинг ниже. Чем больше разница в рейтингах, тем выше вероятность того, что вышестоящий в рейтинговой табели о рангах игрок победит.

Одной из систем, также используемой для обсчета парных встреч, является одна из нескольких, используемых для ранжирования профессиональных теннисных игроков. Система ранжирования АТП присуждает "компьютерные очки", основываясь на типе турнира (т.е. "Большой Шлем", "Чемпьоншип Серия" и т.д.), общем призовом фонде, и наивысшим кругом, до которого дошел игрок перед тем, как был бит (или победой игрока на турнире). Игроки ранжируются по сумме компьютерных очков в соответствии с наилучшими 14 результатами в течение предыдущих 52 недель, или суммой всех компьютерных очков, если они сыграли менее 14 турниров. Эта система не учитывает вероятностные факторы, но выглядит вполне правдоподобно для общественного мнения. Повторяющиеся плохие выступления могут снизить АТП рейтинг теннисиста. Также система АТП добавляет элемент времени, от недостатка которого страдает и ЭЛО, и ряд других систем. ЭЛО использует самый последний начисленный рейтинг как текущий рейтинг игрока, даже если игрок не принимает участия в турнирах в течение долгого времени, в то время как по системе АТП игрок может терять очки из-за недостаточного количества сыгранных турниров. Это свойство более подходит теннису, нежели шахматам, поскольку способности игрока в данном виде спорта имеют большую зависимость от частоты выступлений. Забавным свойством системы АТП является то, что рейтинги могут меняться внезапно. Например, если игрок выиграл крупный турнир, и в течение последующего года выступал средне, то в годовщину великой победы рейтинг игрока может резко упасть. И, таким образом, хоть система АТП и учитывает временной фактор, она не гарантирует плавные изменения в рейтинге.

Статистический Контекст.

Проблема ранжирования шахматных игроков упирается в статистическую модель "попарного сравнения". Данные парного сравнения получаются из любого результата, который указывает степень превосходства одного объекта над другим. Очевидно, шахматы подпадают под эту конструкцию, поскольку шахматная партия есть результат встречи двух игроков, "сравниваемых" для определения, кто есть более "предпочитаемый" игрок (или нет "никакого предпочтения" в случае ничьей). Другие результаты попарного сравнения встречаются в тех видах спорта, где результатом являются победы и поражения, например, футбол, баскетбол, хоккей. Исходы в этих видах спорта могут быть рассмотрены также с точки зрения счетов. Такие области экспериментальной психологии, как поведение выбора и чувственное тестирование, также включают в себя попарные сравнения. Например, "Выбор Пепси" - тест, в котором определяется, предпочитают ли Кока-колу Пепси-коле. Статистик Айовского Государственного Университета Херберт Давид побробно описал статистическое моделирование и анализ попарного сравнения в монографии 1988[3].

[3] The Method of Paired Comparisons, (Oxford Unversity Press, 1988).

Хоть имя Эло в основном ассоциируется с развитием современной системой шахматных рейтингов, статистическое развитие, лежащее в основе системы было создано задолго до его работы в поздних 1950-х, вплоть до его хорошо известной монографии 1978 года [4]. Первой работой, где серьезно рассматривались моделирования шахматных возможностей была работа E. Zermelo в 1929 году [5]. В ней Зермело обращается к проблеме оценивания силы шахматных игроков в незаверщеном круговом отборочном турнире. Статистик И. Ж. Гуд в 1955 году разработал систему, которая обсчитывала ту же модель, что и Зермело, но полученный через другойнабор предположений[6]. Обе эти модели связаны с моделью попарных сранений Бредли-Терри в работе 1952 года[7]. Среди популярных моделей парных сравнений, модель Бредои-Терри имеет самую сильную связь с применяемой в настоящий момент системой ранжирования Эло.

[4] Arpad E. Elo, The Rating of Chessplayers, past and present, (ARCO, 1978)

[5] "Die Berechnung der Turnier-Ergebnisse als ein MaximumProblem der Wahrscheinlichkeitsrechnung," Math. Zeit., 29, 436-460.

[6] "On the Marking of Chess Players", Mathematical Gazette, 39, 292-296.

[7] "The Rank Analysis of Incomplete Block Designs. 1. The Method of Paired Comparisons," Biometrika, 39, 324-45.

Один из путей понимания модели Бредли Терри, или большинство других моделей парных сравнений , о том как они связаны с шахматами, это предположить, что каждый игрок приносит с собой коробку, содержащую пронумерованные кусочки бумаги. Каждый номер представляет из себя потенциальную силу игрока в течение игры. Этот набор значений называется "распределением силы" игрока. Вместо того, чтобы играть в шахматы, каждый игрок открывает свою коробочку и достает в случайном порядке бумажку, и тот у кого число выше - побеждает. То есть эта модель говорит, чтокаждый тгрок способен играть в каком-то диапазоне сил, но в течение игры показывает только один из этих уровней. Естествено, эта процедура благоволит игроку, у которого в ящике лежат в основоном бОльшие номера, но естественно это не означает автоматическую победу. По отношению к шахматам это означает, что более сильный игрок обычно выигрывает, но не всегда.

Модель Бредли-Терри может быть получена посредством предположения о частотном распределении чисел в коробке игрока. Если распределение сил игрока (т.е. распределение чисел в его коробке) является тем, что называют "распделение экстремальных значений", то модель Бредли-Терри работает. График распределения экстремального значения показан на рисунке 1.
Высота кривой в любой точке описывает отностельную частоту , с которой игрок случайно выберет это значение. По модели Бредли-Терри распределение любого игрока подчиняется распределению экстремального значения, имеющего одинаковый график, но центрировано в различных точках в зависимости от общей силы игрока. Заметьте, что кривая спадает более медленно справа, так получается, Что игрок скорее выберет более высокий номер из своей коробочки, чем низкий. Таким образом модель Бредли-Терри постулирует, что игрок проводит встречи с колеблющейся от игры к игре силой, но редко постоянно хуже, нежели его средняя способность.