Вы очень любопытную тему подняли, ув. Tigrolex.
К сожалению, это старая тема
Оптимальной системы подсчета рейтинга не существует, о чем мы до войны беседовали с господином окружным начальником (c) Светлейшим Е-нотом :d
Рейтинг вещь довольно формальная, и совсем неудивительно, что всегда находится кто-то, кому не нравится та или иная его особенность.
Понятие оптимальности может существовать только в тому случае, если будет дан такой же строго формальный список критериев этой самый оптимальности.
Именно формальный и полный список, а не список претензий к Эло Морозевича и других гроссов.
Имея такой список , можно стараться получить экстремум функционала, дающий искомую функцию рейтинга. Можно даже и получить, но с большой вероятностью, что она будет неприподъемна для организма
Но не имея такого списка, говорить об альтернативных методах ( например как это делает уважаемый Е-нот
) совсем непродуктивно.
Поэтому и существуют в мире шахмат пока абсолютные очки и Эло.
Именно формальный и полный список, а не список претензий к Эло Морозевича и других гроссов.
Имея такой список , можно стараться получить экстремум функционала, дающий искомую функцию рейтинга. Можно даже и получить, но с большой вероятностью, что она будет неприподъемна для организма
Но не имея такого списка, говорить об альтернативных методах ( например как это делает уважаемый Е-нот
) совсем непродуктивно.
Поэтому и существуют в мире шахмат пока абсолютные очки и Эло.
Абсолютные очки и Эло существуют потому что это первые ПРОСТЕЙШИЕ приближения при решении насущных задач управления шахматным сообществом. Составление же полного списка претензий - это задача коммунистического завтра. А на сегодня имхо стит просто вторая задача - как адекватно оценить количество носителей высшего звания. Решение этой задачи на спортивных принципах потребует оценки деятельности шахматиста за определенный период. Не до него и не после него а именно с 1-го января по 31 декабря. Тут то мы и наткнемся на необходимость введеня понятия УРОВЕНЬ и АКТИВНОСТЬ. И осознаем несостоятельность абсолютных очков как меры для оценки сугубо релятивистского по своей природе результата партии ... А также непириемлемость последовательного алгоритма Эло опирающегося на результаты до данного периода.
Vlsdimirovich меня как-то сильно удивляет ваш чисто математический подход к проблеме. И это с Вашим то кругозором... Постарайтесь все же на проблему посмотреть физически И решать ее степ бай степ. Пытаясь найти обобщенные координаты, построить модель взаимодействия чего-то там помыслить о законах сохранения (или как скажут продвинутые умники - симметриях) Может чего из биологии притянуть за ужи. А такой выхолощенный чисто математический подход он контрпродуктивен ...
(кстати обнаружил еще одну причину опечаток вместо Н - Т да потому что там же латинская N, которая и воспринимается как русская ...
Vlsdimirovich меня как-то сильно удивляет ваш чисто математический подход к проблеме. И это с Вашим то кругозором... Постарайтесь все же на проблему посмотреть физически И решать ее степ бай степ. Пытаясь найти обобщенные координаты, построить модель взаимодействия чего-то там помыслить о законах сохранения (или как скажут продвинутые умники - симметриях) Может чего из биологии притянуть за ужи. А такой выхолощенный чисто математический подход он контрпродуктивен ...
Ща
Именно отсутствие математического подхода и порождает вечные вопли о несправедливости того или иного метода подсчета.
Кому то влом с любителем в команднике на рейтинг сыграть, а для какого то любителя партия жизни может неучтенной оказаться.
Кому то черными надо рейтинг с кэфом считать, кому то в блиц отдельно, для кого-то ( мы знаем кто это
Бу в Софии каким то боком лучше Иванчука встал.
Нет формальных критериев? Все - вопрос закрыт. Остальное вопли
Тогда
1. Абсолютные очки - W*E
2. Бергер - W*(W*E) - т.е матрица помноженная на абсолютные очки.
3. Можно ввести еще W*(W*(W*E) ) - двойной Бергер и доказывать Е-ноту что это круче *lol*
Это будет битва титанов *lol*
4. Е-рейтинг несколько сложнее чем эти матричные операции. Magin в свое время показывал, что он связан с собственными векторами и числами матрицы.
Т.е - заявление о том, что Е-рейтинг лучший требует введения некоего критерия оптимальности.
Нет критерия - нет оптимальности
Vladimirovich написал(а):
4. Е-рейтинг несколько сложнее чем эти матричные операции.
Magin в свое время показывал, что он связан с собственными векторами и числами матрицы
Kenneth Massey - мой первый или второй интернет-приятель (с 1994 года) показал связь е-рейтинга с цепями Маркова rsport.netorn.ru/ech/theory/erateng.htm
Не подвергая сомнению данный факт отметим, что
1. Связь с цепями Маркова не является критерием оптимальности
2. Цепи Маркова по определению есть такая штука.....
что говоря нестрого по Вики есть
последовательность случайных событий с конечным или счётным бесконечным числом исходов, характеризующаяся тем свойством, что, говоря нестрого, при фиксированном настоящем будущее независимо от прошлого
Естественно, к шахматному соревнованию это имеет весьма отдаленное отношение ...
Magin в свое время показывал, что он связан с собственными векторами и числами матрицы.
Не то, чтобы связан, а именно собственный вектор приведенной матрицы и есть.
Удобен для ранжирования/сравнения любых объектов, для которых нет внешнего эталона. Используется, например, в ранжировании интернет-сайтов (соотношение входящих/исходящих ссылок). Можно использовать для самооценки участников форума.
Недостаток - статичность,- дает слепок текущего состояния без учета динамики.
Достоинство - замкнутость (в смысле отсутствия внешних притянутых за уши констант), как следствие - объективность.
Вообще область применения собственного вектора должна быть широка. Думаю, что соотношение масс эл. частиц тоже связано с собственным вектором подобной матрицы.
всё сидел тут, считал-считал-считал...
Сравнивал адекватность абсолютных очков (АО) и Е-рейтинга (ЕР) на простом круговике.
Сравнивал по критерию, озвученному Енотом.
В очень нестрогом виде этот критерий примерно так формулируется:
более адекватно то ранжирование, которое даёт меньше ошибок при восстановлении из него матрицы результатов турнира.
Можно его таким образом заново нарисовать (здесь используется двухочковая система, т.е. победа даёт два очка):
Код:[/b]Ананд x 1 1 2
Крамник 1 x 2 1
Аронян 1 0 x 2
Карлсен 0 1 0 x
Т.е. - Ананд выиграл у Карлсена, Крамник у Ароняна, и Аронян у Карлсена. Остальные партии - ничьи.
Код:[/b] Е+ Е- Е=
1 Ананд 11.5 2.5 9
2 Крамник 12.5 5.5 7
3 Аронян 5.5 4.5 1
4 Карлсен 2.5 19.5 -17
Ранжирование по ЕР в этом удобном сокращённом виде предоставил Муркенштейн - kasparovchess.crestbook.com/viewtopic.php?pid=281722#p281722 (пост 2822)
Воот.
Короче, ЕР поставил тут Ананда выше Крамника.
Мне это не нравится.
И я попытался найти какие-то числа, обосновывающие мои претензии... И нашёл. Но пока в них не уверен.
Тут довольно много можно написать...
Ограничусь пока лишь тем, что АО совершенно точно предсказывают ничью в партии Ананд-Крамник (в отличие от ЕР).
Но, понятно, с помощью хитрых мат. процедур можно надеяться спасти ЕР. Можно надеяться, что он окажется точнее, чем АО на других результатах партий.
Я совершенно героически - можете мне поверить
- попытался построить матрицы матожиданий результатов на основании АО и ЕР.
И потом, значит, вычитал из этих матриц матрицу реальных результатов...
В итоге - АО победили
Но борьба была упорной
Я планирую потом ещё продолжить свой рассказ. Надеюсь, он уместен...
Важен еще формат турнира. Скажем, круговик (особенно не в один круг) логичнее обсчитывать абсолютными очками, а швейцарку, где каждый играет по сути свой турнир — вообще непонятно чем
Безусловно, Alexander.
Мне именно так и представляется - круговики абсолютно адекватно оцениваются с помощью АО. А вот на швейцарках был бы полезен ЕР или нечто ЕР-образное.
Но Енот упёрся
Он считает, что и для круговиков ЕР лучше.
Поэтому меня и занимает турнир, приведённый выше. Хотелось бы разобраться, даёт ли ЕР худшую или лучшую оценку, чем АО; разобраться на максимально простом примере.
Сравнивал адекватность абсолютных очков (АО) и Е-рейтинга (ЕР) на простом круговике.
Я, может, зря влезаю, но на всякий случай уточняю, что мы, видимо, о разных е-рейтингах говорим.
Для приведенной таблицы
Код:[/b]Ананд x 1 1 2
Крамник 1 x 2 1
Аронян 1 0 x 2
Карлсен 0 1 0 x
собственный вектор (е-рейтинг по Magin) будет следующим (нормируем на Карлсена):
Код:[/b]Ананд 4.6
Крамник 5.0
Аронян 2.2
Карлсен 1.0
(Проверяется прямой подстановкой в матрицу, которую ув. Vladimirovich привел выше).
То есть Ананд сыграл в 4.6 раза лучше Карлсена, Крамник - в 5 раз, Аронян - в 2.2 раза.
С точки зрения математики лучший - Крамник, и это понятно, поскольку он обыграл более сильного (здесь) Ароняна.
Более того даже Аронян по е- [Е-минус] рейтингу обходит Крамника. Потому что Крамник запятнал себя ничьей с Карлсеном - парией данного турнира. Только Крамник с ним поделился за что и страдает.
(Имена тут я опять же поменял соответственно).
Добавлю ещё, что меня-то лично не устраивает ни хитрая логика Енота (Карлсен - пария турнира. Только Крамник с ним поделился, за что и страдает.), ни Ваша, ув. Magin (лучший - Крамник, поскольку он обыграл более сильного Ароняна).
Мне кажется, что Крамник и Ананд сыграли одинаково успешно, были равны.
Я уже упоминал , что в свое время ув. Светлейший Е-нот подсчитал что Бу в Софии, блестяще выигранной Иванчуком , каким то боком встал лучше по е-рейтингу.
Меня это очень удивило
Ув. Magin, конечно, Вы не зря влезаете.
Но теперь у нас получается нестыковочка оч. серьёзная.Приведённая мною ЕР-оценка - исходит изначально от самогО! Енота.
Мы и на КС путались в определениях, и здесь нам как бы не запутаться.
В моем e-рейтинге буква e - английская,- от слова eigenrating - собственный рейтинг (по аналогии с собственным вектором eigenvector).
Физ. смысл собств. рейтинга простой. Если принять, что при каждом поражении мы отдаем долю нашего рейтинга (важно, что долю, а не абсолютное значение), а при выигрыше - получаем, то собственный рейтинг игроков (турнира) - это такой, при котором количество полученного и отданного совпадает (dRi = 0 для всех i).
Вычислим dR Крамника по приведенным выше рейтингам (R1 - Ананд, R2 - Крамник, и т.д.):
dR1 = (R1 - R2) (ничья с Анандом) + 2*R3 (выигрыш у Ароняна) + (R4 - R2) (ничья с Карлсеном) = 4.6 - 5 + 2*2.2 + 1 - 5 = 0,
что и требовалось доказать.
Такой же инвариант выполняется для всех других игроков. В этом - основа e-рейтинга (или по русски правильнее с-рейтинга?). Нет никаких других мат. объектов, которые бы обладали подобными свойствами. Именно поэтому для турниров (любых,- круговик, швейцарка, матч) собств. рейтинг наиболее объективен.
Отношение силы игроков (по итогам соревнования) - это отношение их собств. рейтингов. Отсюда ясно, что собств. рейтинг не может быть отрицательным (если не прологарифмован).
Добавлю ещё, что меня-то лично не устраивает ни хитрая логика Енота (Карлсен - партия турнира. Только Крамник с ним поделился, за что и страдает.), ни Ваша, ув. Magin (лучший - Крамник, поскольку он обыграл более сильного Ароняна).Мне кажется, что Крамник и Ананд сыграли одинаково успешно, были равны.
Ну, я бы не стал претендовать на авторство логики. Это логика собственного рейтинга.
В целом для меня выигрыш у более сильного весомее,- тут я с собств. рейтингом соглашусь. Но какие из этого делать выводы - вопрос интерпретации.
Физ. смысл собств. рейтинга простой. Если принять, что при каждом поражении мы отдаем долю нашего рейтинга (важно, что долю, а не абсолютное значение), а при выигрыше - получаем, то собственный рейтинг игроков (турнира) - это такой, при котором количество полученного и отданного совпадает (dRi = 0 для всех i).
Вычислим dR Крамника по приведенным выше рейтингам (R1 - Ананд, R2 - Крамник, и т.д.):
dR1 = (R1 - R2) (ничья с Анандом) + 2*R3 (выигрыш у Ароняна) + (R4 - R2) (ничья с Карлсеном) = 4.6 - 5 + 2*2.2 + 1 - 5 = 0,
что и требовалось доказать.
Такой же инвариант выполняется для всех других игроков. В этом - основа e-рейтинга (или по русски правильнее с-рейтинга?)
Хм, а ведь это правило, кажется, выполняется и для Е+ :
Код:[/b]Е+
1 Ананд 11.5
2 Крамник 12.5
3 Аронян 5.5
4 Карлсен 2.5
Т.е., С-рейтинг = E+ ?
E+ - это, по Еноту, рейтинг силы.
Его логика сходна с логикой коэффициента Бергера: прибыль при победе над сильным - больше, чем убыток при поражении от слабого.
Эта логика мне представляется уязвимой для критики.
Хм, а ведь это правило, кажется, выполняется и для Е+ :
Точно, я сразу и не обратил внимания.
Edwards написал(а):
Т.е., С-рейтинг = E+ ?
E+ - это, по Еноту, рейтинг силы.
Вообще исходный посыл для с-рейтинга был динамическим. То есть предлагалось заменить Эло (а он динамический) на более простую формулу:
dRi = C*(wij*Rj - wji*Ri), (1)
где C - коэффициент релаксации.
Преимуществ много. Одно из основных - соблюдение баланса (как в бухгалтерии),- сколько у одних убыло, столько у других прибыло.
При такой форме записи логика перетекания рейтинга кажется мне оправданной. Все потери рейтинга пропорциональны собственному (не зависят от соперника), все приобретения - пропорциональны рейтингу соперника (не зависят от собственного).
При ничьей рейтинг течет от более сильного к более слабому, что тоже выглядит логичным.
А уже из формулы (1) мы получаем собств. рейтинг, приравнивая все dRi нулю. Если при этом с-рейтинг становится похож на Бергер - плюс Бергеру.
Если есть другие простые, логичные и мат. обоснованные системы - в студию.
Edwards написал(а):
Его логика сходна с логикой коэффициента Бергера: прибыль при победе над сильным - больше, чем убыток при поражении от слабого.
Поскольку убыток зависит от рейтинга самого игрока, а прибыль - от соперника, то в общем случае утверждение неверно (для рассматриваемой системы рейтингов).
Интересен мат. аспект алгоритма вычисления с-рейтинга (Е+). Больно уж числа неприлично целые (после приведения) - 23, 25, 11, 5.
Может, существует какой-то более простой способ вычислений собств. вектора для матрицы с нулевыми диаг. элементами и условием wij+wji = const? Такое ощущение, что существует какой-то прямой алгоритм, без решения системы лин. уравнений.
Если есть другие простые, логичные и мат. обоснованные системы - в студию.
Хм, ну имеем уже представленными две других - АО и ЕР.
За АО готов впрягаться я. Но - именно в отношении круговиков (и матчей, конечно) - понятно, что при сложных турнирных форматах (вроде швейцарок), при работе с плохо упорядоченными массивами данных АО плохи.
ЕР имеет перед представленным Вами С-рейтингом (CP) то (возможное) преимущество, что он рассматривает картину событий, так сказать, с обеих сторон.
Если в CP (и E+) убыток зависит от рейтинга самого игрока, а прибыль - от соперника, то в Е- всё ровно наоборот (а ведь действительно, почему бы всему не быть ровно наоборот?) - убыток зависит от рейтинга соперника, а прибыль - от самого игрока.
И вот в ЕР эти два взгляда на ситуацию складываются в единую картину...
По поводу логичности и обоснованности - имхо, тут весьма перспективна идея всё-таки проверить наши системы по критерию Енота. Т.е. как-то отобразить итоговое ранжирование в матрицу результатов, которую оно предсказывает - и сравнить с матрицей реальных результатов, выяснить количество ошибок, продуцируемых разными способами ранжирования.
Его логика сходна с логикой коэффициента Бергера: прибыль при победе над сильным - больше, чем убыток при поражении от слабого.
Поскольку убыток зависит от рейтинга самого игрока, а прибыль - от соперника, то в общем случае утверждение неверно (для рассматриваемой системы рейтингов).
ОК, давайте я введу уточнения. В круговике при сравнении игроков с равными (близкими) результатами по АО - прибыль при победе над сильным - больше, чем убыток при поражении от слабого.
Имхо, это наиболее интересная, наиболее интригующая ситуация:
1. Есть круговик - каждый играет с каждым.
2. Есть одинаковые по АО результаты у двух игроков.
И тут вдруг кто-то приходит и говорит - нет, на самом деле Ананд сыграл лучше Крамника (или наоборот).
Мне жутко интересно разобраться в том, каковы основания для таких заявлений у этого кого-то...
Хм, ну имеем уже представленными две других - АО и ЕР.За АО готов впрягаться я. Но - именно в отношении круговиков (и матчей, конечно) - понятно, что при сложных турнирных форматах (вроде швейцарок), при работе с плохо упорядоченными массивами данных АО плохи.
Да, АО неплох в первую очередь своей простотой. Но в этом и его ограниченность. Хорош в качестве 1-го приближения. При отсутствии компов безальтернативен.
Но даже в турнирах его применение не всегда однозначно. Как, например, следует обсчитывать командные соревнования? Дискретно (поражение, ничья, победа) или с учетом счета матча (8:2 это вроде как не то же самое, что 6:4)?
Edwards написал(а):
(а ведь действительно, почему бы всему не быть ровно наоборот?) - убыток зависит от рейтинга соперника, а прибыль - от самого игрока.
Я не смог построить такую модель. Формулу бы какую или пример привести.
Рейтинги соперников R1 и R2. Как будут рассчитаны прибыли/убытки для всех возможных результатов (0, 1/2, 1)?
ОК, давайте я введу уточнения.В круговике при сравнении игроков с равными (близкими) результатами по АО - прибыль при победе над сильным - больше, чем убыток при поражении от слабого.
Почему? Необязательно.
Если я победил того, чей рейтинг выше моего, то да - моя прибыль выше, чем убыток от поражения (неважно кому).
Если же я победил того, чей рейтинг ниже моего (даже не намного), то прибыль меньше, чем от поражения (неважно кому).
А кореляция, про которую вы говорите, возникает только для турниров с малым кол-вом участников. Если побеждаешь сильного, то проиграть можешь только слабому (вариантов немного).
Edwards написал(а):
И тут вдруг кто-то приходит и говорит - нет, на самом деле Ананд сыграл лучше Крамника (или наоборот).
Мне жутко интересно разобраться в том, каковы основания для таких заявлений у этого кого-то...
Крамник оказался выше Ананда не потому, что сыграл вничью со слабым Карлсеном (столько же он отдал и сильному Ананду), а потому что забрал рейтинг у сильного Ароняна.
Считаем полученное: Крамник получил две доли от сильного Ароняна и одну от слабого Карлсена. А Ананд наоборот. Вот и получилось у Крамника больше. Это логика собств. рейтинга.
Да, АО неплох в первую очередь своей простотой. Но в этом и его ограниченность. Хорош в качестве 1-го приближения. При отсутствии компов безальтернативен.
Я вот всё-таки настаиваю на том, что для круговиков АО хороши вовсе не только и не столько своей простотой и уместностью при отсутствии компов. А хороши - железной логикой.
Вернее, мне представляется, что АО в круговиках - это некое правильное сокращение какой-то железной логики, заложенной в нечто ЕР-(или СР-)-образное.
Не просите меня сейчас формализовать эту мысль. Ибо это я всего лишь раскрываю некие интуитивные основания своей позиции.
А подход к формализации (которую я очень уважаю) - я предлагаю искать в районе критерия Енота.
Хотя бы потому, что никакого другого критерия адекватности ранжирования - предложено пока вроде не было.
Magin написал(а):
Edwards написал(а):
(а ведь действительно, почему бы всему не быть ровно наоборот?) - убыток зависит от рейтинга соперника, а прибыль - от самого игрока
Я не смог построить такую модель. Формулу бы какую или пример привести.
Рейтинги соперников R1 и R2. Как будут рассчитаны прибыли/убытки для всех возможных результатов (0, 1/2, 1)?
О, Magin!?!
Я, к сожалению, не спец в математике, но... Но мне моя мысль казалась очень прозрачной - Е- как некое зеркало от Е+(СР).
Я попробую сейчас воспроизвести некую формулу, связанную с Е-, просто опираясь на Ваш пост о CP (Е+).
Итак, имеем:
Magin написал(а):
Вычислим dR Крамника по приведенным выше рейтингам (R1 - Ананд, R2 - Крамник, и т.д.):
dR2 = (R1 - R2) (ничья с Анандом) + 2*R3 (выигрыш у Ароняна) + (R4 - R2) (ничья с Карлсеном) = 4.6 - 5 + 2*2.2 + 1 - 5 = 0,
что и требовалось доказать.
Переформулируем это для Е- (оно же - Анти-СР):
Вычислим dR Крамника по приведенным ниже рейтингам (R1 - Ананд, R2 - Крамник, и т.д.):
Код:[/b]Е-
1 Ананд 2.5
2 Крамник 5.5
3 Аронян 4.5
4 Карлсен 19.5
(Убыток зависит от рейтинга соперника, а прибыль - от самого игрока)
dR2 = (R2 - R1) (ничья с Анандом) + 2*R2 (выигрыш у Ароняна) + (R2 - R4) (ничья с Карлсеном) = 3 + 11 - 14 = 0,
что и требовалось доказать.
О, Magin!?!Я, к сожалению, не спец в математике, но... Но мне моя мысль казалась очень прозрачной - Е- как некое зеркало от Е+(СР).
Да математика-то должна быть проста. Как получили цифры Е- (5, 11, 9, 39)?
Пробую угадать. Е- - это некий рейтинг потерь (слабости)? Его смысл обратен прямому Е+? Чем выше E-, тем меньше сила игрока? То есть проигрыш увеличивает Е-, а выигрыш уменьшает? Причем для более сильного увеличения надо проиграть более слабому?
Такая формула:
dPi = С*(vij*Pj - vji*Pi) ?
здесь вместо Е- используется P - рейтинг слабости, vij = 1-wij.
Пример. Соперник слабее меня в 2 раза. У меня P1 = 100, у соперника P2=200.
При моем выигрыше получаем (C=0.1):
dP1 = 0.1*(-1*100) = -10; dP2 = 0.1*(1*100) = 10. То есть я как бы уменьшил свою слабость, а соперник увеличил. Причем прибыль (уменьшение слабости) зависит от моего рейтинга (а не от соперника). Новое соотношение сил: P1/P2 = 90/210. Соперник стал слабее меня в 2.33 раза. Если я еще раз выиграю, то соотношение будет P1/P2 = 81/219 и т.д.
Я проиграл:
dP1 = 0.1*(1*200) = 20; dP2 = 0.1*(-1*200) = -20. Я увеличил слабость, причем намного (из-за того, что слабость соперника высока). Новое соотношение сил: P1/P2 = 120/180. Соперник стал слабее меня всего в 1.5 раза.
Ничья:
dP1 = 0.1*(0.5*200-0.5*100) = 5; dP2 = -5. Я увеличил слабость, поскольку сыграл вничью с соперником, который слабее меня.
Так, вроде пока логично.
Резюмируем. Наверное, подобный рейтинг имеет право на существование. Но это именно отражение прямого рейтинга (СР = Е+). Мыслить в терминах слабости (а не силы) - не для слабых умов. (Интересно, какой должен быть начальный рейтинг слабостей?)
Или можно как-то сложить два этих рейтинга (силы и слабости) в один?
Я так понял, что если применить логику слабости к результатам турнира с требованием dPi=0, то получим собственный рейтинг слабостей (типа приведенного выше)? Навскидку мне кажется, что отношение рейтингов слабости должно быть обратно отношению рейтингов силы. Неужели не так? Проверю на досуге.
Но даже если два собственных рейтинга дают разные соотношения сил (в чем пока не уверен), то на каком основании мы их складываем? А не умножаем, например, или делим.