Ранее ув. Magin указывал что Про е-рейтинг
собственные значения и собственные вектора определяют собственный Е-рейтинг
Тема интересная, но не получила должного развития.
Тема исчерпала себя ввиду закрытия вопроса (для меня во всяком случае).
Собственный вектор en.wikipedia.org/wiki/Laplacian_matrix лапласиана Ei от матрицы результатов (смежности) Lij для 0-го собственного значения (вектор потенциалов, если использовать терминологию электрических сетей) - это и есть статический вектор рейтинга участников по итогам одного турнира:
Ei * Lij = 0
Здесь ноль в правой части - следствие требования баланса - сколько рейтинга участники получают,- столько же и раздают.
Вектор считается относительно просто,- сложность алгоритма такая же, как при расчете обратной матрицы.
Ну и что тут развивать?
1. Спасибо что вернулись, поскольку введение терминов типа лапласиан, собственные вектора, гамильтониан и тд несомненно перекидывает мостик и к математике и, что мне представляется особенно перспективным к физике. Это серьезно. Потому что использование физических моделей, понятий, ассоциаций, позволяет ИМХО более цивилизованно построить модель шахматного (спортивного и не только) сообщества. Более адекватно оценить происходящие процессы. Это конечно же не механицизм, а стремление использовать более совершенные инструменты... В голову приходит какая-нибудь модель электронных оболочек в атоме, которые можно сопоставить с итоговой турнирной таблицей... Кстати на заре создания квантов именно футбольные таблицы использовались при построении модели атома
2. С точки зрения математики - ничего и не было
Все вопросы находятся в области применения, содержательной интерпретации и анализа эффектов существующих реально, но никак не учтенных моделью.
Ну вот например.
А. Изменение УРОВНЯ мастерства на протяжении определенного периода. Е-рейтинг мы можем рассчитывать не только для одного турнира, но и для совокупности. В принципе берем все результаты поервой тысячи - двух и считаем определители матрицы никаких математических проблем. Однако для молодых - например год - большой период. Его УРОВЕНЬ мастерства изменилось. ( Специально использую термин УРОВЕНЬ для е-рейтинга а не СИЛУ, которая уместна для алгоритма ЭЛО)
Б. Еще проблема - мотивация. Концептуально можно представить ИЗМЕРЕННЫЙ (РАССЧИТАННЫЙ) УРОВЕНЬ как, например произведение СОБСТВЕННО УРОВНЯ на МОТИВАЦИЮ. Другими, гуманитарными терминами, это попытка учесть тот факт, что играя в силу обстоятельств во второразрядном турнире, шахматист не мобилизирует все свои возможности. Да и сама система абсолютных очков делает такую мобилизацию бессмысленной, если нет дополнительных стимулов. Недаром американцы учредили приз Фишера за 100%
Кстати различные доп призы хорошо помогают решить многие казусы ранжирования при использовании абсолютных очков. Эти призы как латки и ветхом кафтани прикрывают дыры древней примитивной системы. И вместе с тем естественно убивают интерес к более совершенным алгоритмам. Действительно чего еще придумывать, если и так все хорошо ...
В. Вот еще проблемка - соотношение косвенной и прямой оценки соотношения сил.
Иванов -Петров 30-10
Петров - Сидоров 30-10
Полагая транзитивность (а что еще?) оцениваем Иванов - Сидоров 90 - 10
Реально счет 5 - 5
Как определить соотношение сил? Полагаться только на реальный результат? Или учесть косвенный?
В общем загадок, вопросов множество ... Одна проблема - найти заинтересованное лицо во властных структурах. Ведь шахматные (спортивные) проблемы характерны и для всего социального сообщества. Недаром говорится спорт - модель жизни ...
введение терминов типа лапласиан, собственные вектора, гамильтониан и тд несомненно перекидывает мостик и к математике и, что мне представляется особенно перспективным к физике.
Насчет перспектив мне сложно говорить. Есть математически строго определенный вектор (действительно используемый в разных прикладных областях), который применительно к результатам турнира похож на вектор относительной силы участников.
Вопрос интерпретации (физического смысла) математических величин не всегда прост - с той же волновой функцией, например, вопрос, на мой взгляд, не закрыт.
То есть данный собственный вектор похож на вектор силы, но действительно ли можно ли его назвать силой и что такое сила? Проблема определений.
Vladimirovich написал(а):
Примерчиков бы практических для народа - Линарес или Вейк
Дак были ведь уже примеры, и теоретические, и практические.
Любой, кто умеет пользоваться экселем, может посчитать рейтинг участников турнира за 5 минут.
Вот, например, результаты последнего Вейка:
Score Rating
Aronian, L. 9.0 347
Carlsen, M. 8.0 268
Radjabov, T. 8.0 253
Caruana, F. 8.0 231
Ivanchuk, V. 7.5 219
Nakamura, H. 7.5 203
Kamsky, G. 7.0 182
Karjakin, S. 6.5 145
Van Wely, L. 5.5 132
Topalov, V. 5.0 101
Gelfand, B. 5.0 99
Gashimov, V. 5.0 86
Navara, D. 4.5 100
Giri, A. 4.5 89
Аронян в 3.5 раза сильнее Навары, несмотря на то, что проиграл ему в личной встрече. Какие глубокие выводы можно из этого извлечь, мне не очень понятно.
У троих игроков поровну очков, а рейтинг разный. Надо думать, они выиграли/проиграли игрокам разной силы (рейтинга). Аронян в то же время набрал всего лишь на очко больше, но при этом имеет рейтинг аж на 40% больший, хотя он проиграл аутсайдеру!
Я тут случайно обратил внимание, что рейтинг Эло и qps.ru/PhBWl число Вольфа вычисляются, можно сказать, по одной и той же формуле f + 10g, хотя интерпретация разная, конечно. Но самое интересное то, что в формуле для числа Вольфа W со временем появился поправочный коэффициент k - множитель, зависящий от наблюдателя: W = k(f + 10g). Поскольку наблюдателей - как и желающих подсчитывать рейтинги - не один, а много! Для самого Вольфа k = 1, а для всех остальных k = 0.4-1.7.
Вот интересная статья про рейтинги, не шахматные, но вообще. Оказывается, в известном смысле одни рейтинги похожи на твердое тело, другие - на жидкость, а третьи - на газ. И это не просто качественная аналогия, но аналогия, прорабатанная авторами-физиками количественно.
Однако есть проблемка в которую желательно желательно перетереть по существу... Каким образом учесть черный и белый рейтинги? Чисто эмпирический подход не уместен, это путь в никуда. А хорошего модельного решения пока не вижу ...
А что Вы называете чисто эмпирический подход . Если введение некоего эмпирического коэффициента, то без этого все равно не обойтись.
Достаточно взять предельные случаи - 50-50 и 100-0 при игре белыми и черными.
В первом случае - кэф 1 - что белыми, что черными, все едино, во втором вообще рейтинг теряет смысл, т.е кэф уходит в
Видно существенное влияние стартовых номеров. Хорошо ди это? Т.е. уже при жеребьевке закладывается неравенство.
Ну это всегда так было. Причем в разных видах спорта. Полного равенства нигде нет.
Например в футболе в первом тайме солнце в глаза, а во втором дождь
Это проблема уже второго порядка. Зачем измерять рулеткой шоссе до Владивостока...
Проблема белых и черных не сегодня появилась.
Формально нужно считать гроссмейстера белого и черного разными людьми.
Тем более, что есть яркие белоцветчики а есть не очень.
Тут проблемы нет, рейтинг можно считать.
Проблема будет когда нужно свести два числа в одно. Вот тут то и нужен эмпирический коэффициент.
Причем для каждого гросса он будет разный - можно сравнить с пересчетом без учета белого и черного.
Формально нужно считать гроссмейстера белого и черного разными людьми.
Да с точки зрения прогнозирования (специфика рейтинга Эло) это справедливо. А вот с точки зрения распределения призовых (специфика Е-рейтинга) не совсем понятно ... Хотя конечно можно было бы просто складывать рейтинги, или вообще распределять призовые по 16-и участникам. Но как быть с тем что разное кол-во партий сыгранных белыми и черными ... умножать на число партий? Но там что-то не стыкуется с нормировкой ...
Вы можете соглашаться со мной или нет, но, по моему мнению, самым большим очарованием для игроков шахматных турниров или соперников в других видах спорта является измерение их игровой силы. Система ранжирования Эло, разработанная в начале 60-х Арпадом Эло, была первой шахматной системой ранжирования, которая несла в себе вероятностную основу. Позже она была принята многими шахматными федерациями и даже организациями, отвечающими за такие игры, как Scrabble, настольный теннис и т.д. Хоть система Эло и является значительным шагом вперед по отношению к более ранним системам, у нее тоже есть свои проблемы. В 1995 году, в ответ на имеющиеся там недостатки, я создал систему ранжирования Глико. Система моя получена путем рассмотрения статистической модели исходов шахматных игр, и принятия затем математических приближений, позволяющих простейшие вычисления. Система Эло является одним из специальных случаев моей системы. Математические детали могут быть найдены в статье под названием «Оценка параметра в больших экспериментах попарных сравнений», выдержки из которой были опубликованы в статистическом журнале «Прикладная статистика», или их можно найти в Моих работах. Система Глико применяется в настоящий момент на свободном интернетовском шахматном сервере (FICS), а вариации системы Глико были приспособлены для нескольких коммерческих интернетовских игровых организаций, таких как ChronX, Case's Ladder и других.
Проблема Системы Эло, которую исправляет система Глико, это достоверность рейтинга игрока. Предположим, что два игрока, оба с коэффициентом Эло в 1700, встречаются на турнире, и первый побеждает второго. По версии Системы Эло Американской Шахматной Федерации первый игрок получит в этом случае 16 рейтинговых очков, а второй игрок потеряет те же 16 очков. Но предположим, что первый игрок только что вернулся к играм на турнирах после многих лет «отдыха», а второй игрок режется в шахматы каждый выходной. В этой ситуации рейтинг первого игрока в 1700 очков является не совсем достоверным отражением его силы, в то время как рейтинг второго игрока в 1700 является вполне реальным отображением его игрового мастерства. Моя интуиция подсказывает мне, что
(1) рейтинг первого игрока должен увеличиться существенно (больше 16-ти), поскольку его рейтинг не совсем реален, и то, что он побил игрока с практически точным рейтингом в 1700 очевидно наводит на мысль, что его сила заведомо превышает 1700, и
(2) рейтинг второго игрока должен немного уменьшиться (менее 16-ти очков), поскольку про его рейтинг и так уже известно, что а) он находится в районе 1700, и б) он проиграл игроку, чей рейтинг не заслуживает доверия, и потому о его собственной игровой силе могут быть сделаны лишь небольшие догадки.
1 пункт очевидно сделан под влиянием тогдашней инфляции. Сейчас будет все наоборот, с большой вероятностью.
Хоть большинство ситуаций не столь экстремальны, мне кажется, что в систему ранжирования полезно включить меру достоверности чьего-либо рейтинга. Потому-то система Глико и превосходит Систему Эло, что вычисляет не только рейтинг R, который может быть представлен, как «наилучшая догадка» о чьей-либо игровой силе, но и «рейтинговое отклонение» (RD) (в статистической терминологии – стандартное отклонение), которое измеряет неопределенность рейтинга. Высокие RD отвечают ненадежным рейтингам, указывая, что игрок выступает не часто или что игрок участвовал лишь в небольшом количестве игр. Низкий RD указывает на то, что игрок постоянно принимает участие в турнирах.
Здесь мы отметим, что вопрос о "превосходит" это отдельная тема, но главное - отличается и не совпадает.
В системе Глико игровой рейтинг изменяется только по прошествии игр, но его RD изменяется и после окончания игры, и по прошествии времени, в течение которого игрок не принимал участия в турнирах. Одним из свойств системы Глико является то, что сыгранные матчи всегда уменьшают RD игрока, а время, проведенное вне турниров, всегда его увеличивает. Смысл этого заключается в том, что чем больше сыграно игр, тем больше информации о способностях игрока получено, и тем точнее становится рейтинг. Время идет, и мы начинаем сомневаться в силе игрока, и это находит свое отражение в возрастании RD.
Обратите внимание, что в системе Глико изменения в рейтинге не столь сбалансированы, как это есть в Системе Эло. Если рейтинг одного игрока возрос на x очков, то совсем необязательно, что рейтинг его соперника уменьшится на те же x очков. Фактически в системе Глико количество очков, на которое уменьшится рейтинг соперника, регулируется значениями RD обоих игроков.
Поскольку игрок в системе Глико имеет и рейтинг, и RD, то обычно более информативно описать силу игрока в виде интервала (нежели просто указать его значение). Одним из путей является создание 95% доверительного интервала. Наименьшим значением интервала является рейтинг игрока минус двойной RD, а наивысшим значением является рейтинг игрока плюс двойной RD. Так например, если чей-либо рейтинг равен 1850 и RD равно 50, то интервал будет простираться между 1750 и 1950. Мы можем сказать тогда, что мы на 95% уверены, что реальная сила игрока лежит находится между 1750 и 1950. Если у игрока низкий RD, то интервал будет уже, и мы будем на 95% уверены в реальной силе игрока в меньшем интервале значений.
Далее идут формулы, которые мне лень копировать из картинки. Тем более суть изложена адекватно выше.
на ИКЧФ новая рейтинговая система сделана этим Гликманом и введена осенью прошлого года...
С учётом ничейных тенденций адванса победы дают ещё больший прирост, чем "чистая" система Глико
Собссно, у меня нет особых возражений против Глико
Идея в принципе разумна
Неразумен подход отдельных деятелей, пляшущих вокруг с бубном
И не понимающих разницы математик
... сыгранные матчи всегда уменьшают RD игрока, а время, проведенное вне турниров, всегда его увеличивает. Смысл этого заключается в том, что чем больше сыграно игр, тем больше информации о способностях игрока получено, и тем точнее становится рейтинг. Время идет, и мы начинаем сомневаться в силе игрока, и это находит свое отражение в возрастании RD.
Насколько понял, меньше играешь - больше рейтинга теряешь. Если набрать определённый рейтинг, а затем всё оставшееся время не играть, то величина будет падать по экспоненте до какого-то предельного уровня. График убыли рейтинга похож на график периодов полураспада радиоактивных химических элементов.