2013 год
Эта тема в какой то мере продолжение общерейтинговой Рейтинг Эло и Идеальный рейтинг
но здесь будут попытки применения вероятностной модели силы непосредственно к топ-элите.
Напомним, сила игрока по шкале Эло предполагается в виде некой вероятностной функции f от Эло соперников, имеющей гипотетически псевдогауссову форму.
Сила соперников для простоты предполагается постоянной.
Итак, возьмем % игрока для кучек 2600-2650 2650-2700 и т.д. И построим функцию.
Теоретически такая зависимость не есть интегральная вероятность для f, но поведение будет похоже
И это будет наше последнее допущение и небольшая некорректность
Т.е если взять производную от того, что получится, мы получим распределение силы шахматиста.
Сегодня он играет на 2700, а завтра глядишь и 2800 накатает. А потом откушает в баре и оппа уже 2650.
Это и будет наш искомый псевдогаусс. Максимумы на нем будут соответствовать основным уровням силы.
Заметим, что их может быть и несколько. Вот и все с нашей моделькой.
Практически что будет означать околонулевая производная на диапазоне - в данную силу гросс не играет
Он может играть значительно ниже или значительно выше, но не в эту. Ибо при уровне скажем в 2700 плюс минус 40 от 2700 у соперника уже важно, результаты будут отличаться. А так, если гросс сливает 3 из десяти неважно 2650, или 2700, значит он играет значительно лучше 2700.
Практически что будет означать максимум производной... Это некий базовый уровень силы соперников, сильно влияющий на результаты
Светлейший бы сказал квантовый уровень силы, но мы повременим
Итак. Возьмем Крамника (с 2009), Карлсончега (с 2009) и Левончега (с 2010)
С указанного времени они не опускались вроде ниже 2780, который и будет уровнем верхней кучки.
Что получилось ( конечно на абсолютную точность не претендуя)
Интересен "провал" графика Карлсена с шахматистами 2700-2750, но надо учесть что блиц я не фильтровал
Это хлопотно, меня пока интересовала лишь идея.
Что получилось с производной
Дальнейшее будет бальзамом на раны крамникофобам
Первые максимумы получаются на 2700 у обоих К К и 2680 для Левончега.
Пусть не удивляют абсолютные значения. Они же не 50% берут на них. Это просто некие критические уровни.
Т.е Левончег объективно послабее обоих пока.
Но у Магнуса и Левончега есть второй подъем около 2780, что говорит о перспективах дальнейшего роста
У Крамника этого нет. Рассчитывать на его новый взлет трудно.
Сошлемся для полноты картины на труды ( имеющие историческую ценность ) Светлейшего в этой области rsport.netorn.ru/enot/books/12_elo.htm
И вырезать несколько цитат
Рассмотрим встречу двух игроков. Обозначим оценки класса, т.е. рейтинги игроков U и V через r(V) соответственно.
Все же здесь уместнее использовать термин «сила», оставив термин «класс» для дискретных величин. Конечно, это не принципиально, как назвать ту или иную величину. И все же мы не компьютеры и наше ассоциативное мышление часто выручает нас там, где подводит логика.
Введём в рассмотрение переменную величину t, характеризующую различие в классе игроков U и V.
Величину t можно предположить зависящей, например, от отношения r (U) / r (V) рейтингов игроков U и V или же от их разности r(U) - r(V).
Статистика шахматных турниров свидетельствует о том, что если один из соперников на один разряд (на одну ступень) в шахматной иерархии стоит выше другого, то первый выигрывает у второго, в среднем, 75 очков из 100 возможных, т.е. с вероятностью, равной 0,75.
Полученное совпадение говорит о том, что в качестве отправной разницы в рейтингах в системе Эло принято число 200.
Таким образом, система Эло имеет определённое теоретико-статистичесоке обоснование. Её правомерность подтверждена статистической достоверностью прогнозов.
Вот ведь, это сам Светлейший писал
В системе Эло вводится начальный рейтинг. Для оценки силы этот прием оправдан, поскольку, рейтинг Эло постепенно «забывает» прошлые результаты. А как быть в оценке результатов турнира? Если установить всем одинаковый рейтинг, то возникает проблема «расписания» - тот, кто встречается с более слабыми соперниками на старте имеет преимущество. Введение же перед турниром разных стартовых рейтингов – вообще не приемлемо.
Ну, конечно же, здесь идет смешение понятий «достижение» и «сила»
chess-news.ru/node/18575
Смешная математика. Алексей Широв: "Система рейтингов нуждается в срочной реформе"
Гроссмейстер Алексей Широв считает, что систему подсчета рейтингов для классических, быстрых шахмат и блица необходимо изменить как можно скорее. Об этом он написал на своей странице в Фейсбуке.
(Перевод с английского - Chess-News)
"Просто смешно, что классическая партия (по крайней мере, между взрослыми гроссмейстерами) считается с коэффициентом К=10, а рапид и блиц - с К=20. При том, что в день можно легко сыграть двадцать блицпартий, а классических мало кто играет больше одиннадцати за месяц. К=10 в классике имело смысл в те времена, когда рейтинг считали дважды в год, но не сейчас".
Широв предлагает основным коэффициентом в классических партиях сделать К=20; в тех случаях, в которых сейчас коэффициент меньше 15, предлагается сделать К=30; сохранить К=40 для всех соответствующих случаев. Для быстрых партий К=15, для блица К=10, в обоих случаях независимо от возраста игрока и его рейтинга.
"При этой системе изменения рейтингов в классике, рапиде и блице будут иметь, по крайней мере, некоторое сходство", - заключает гроссмейстер. По словам Широва, эти предложения - продукт размышлений не только его собственных, но и Михаила Красенкова и некоторых других.
Математика действительно смешная. Все что предлагает гроссмейстер, чем-то напоминает известный анекдот про последний вагон.
Собственно весь баланс топа-100 по Эло основывается на том, что K=10
Если его К изменить, то и все рейтинги съедут.
Сейчас на вершине относительная стабильность
Нельзя сказать, что Эло идеально отражает реальность, но хотя бы, что есть.
Призыв к большим коэффициентам означает, что гроссмейстер давно забыл, как меняются рейтинги при <2400
Ну или на ШП в блиц
Смысла в них вообще никакого нет с точки зрения прогноза.
Итак, прошло два года.
Левончег ушел в тень
Посмотрим пока на четверых
Видно, что Ананд и Крамник уже все. После 2800 спад.
Но выглядят они по разному. У Крамника длинная горка. Т.е играет себе равномерно в диапазоне 2650-2800. Это предел.
У Вишика же два пика. Может сыграть плохо, а может на 2800. Но дальше тоже все.
Карлсончег уже не имеет той перспективы, что раньше. Т.е. достиг насыщения, хотя видно еще есть резервы.
Но основной его пик на 2750. Т.е там реально он по классу.
Шахматистов ниже этого уровня он начинает мести почти под 0.
А топ-игроков он берет не классом, а счетом и физикой.
Топа показывает неожиданные результаты однако. Получается, что у него большой резерв и он может сыграть очень сильно при случае.
Впрочем на 2800 не так много статистики, да и блиц не вычитал, ибо лень, так что звиняйте, если Карлсончега обидел
Наверняка у Карлсена проблемы с мотивацией. Он уже все выиграл, и непонятно зачем держать ту концентрацию, что привела к максимальному рейтингу в истории.
Но основной его пик на 2750. Т.е там реально он по классу.
Это ещё что за чушь?
Шахматистов ниже этого уровня он начинает мести почти под 0.
Вы уж там господа карлсенофобы определитесь в показаниях... То он у вас с шахматистами ниже 2750 играть не умеет а обыгрывает только тех кто выше этого уровня, теперь он оказывается и с теми кто выше 2750 играть не умеет.
Может он вообще играть не умеет? Правила хоть знает?
А топ-игроков он берет не классом, а счетом и физикой.
Это детский сад какой-то... В жопу таких "топ-игроков" , если их можно обыграть просто хорошей физической формой, при этом не умея играть в шахматы.
Применим нашу новую революцьонную теорию еще к 4 участникам Синкфилда
Собссно здесь также видно, что Левончег на спаде. Пока его перспективы не видны.
Несмотря на победу вчера
Максим пока за 2800 не высовывается по уровню
Абрамыч. Объективно слабее всех остальных - пик на 2700.
Зато иногда - какие в нем бездны! - если, конечно, хорошо покушает за день - какие бездны в нем по вечерам! (с)
Грищук. 2800 предел. Перспектив более не имеет.
Сирожик. Есть в нем потенциал, но какой то безликий.
Вот.
А не пора ли нам замахнуться на Гарика нашего Каспарова...
Для особого интереса мы возьмем заключительный период его карьеры - 1998-2001 годы
А также сравним их с результатами Крамника за то же время
И здесь выясняется "неожиданное"
Их характеристики практически идентичны в то время
Напомним, что абсолютные значения не должны приниматься, как сильно значимые.
Вообще говоря, все должно быть отнормировано на общий интеграл 1, ибо это вероятность
Нас интересуют нули и экстремумы
Пики на 2650 у обоих отражают их "нижний" уровень. И большинство их партий тут это рапид (в Монако например) или блиц
А далее мы видим их отчетливый уровень 2800. У Гарика чуть подальше
Это означает, что в 2000 году встретились два лучших в то время шахматиста на пике формы, без дальнейших перспектив
И как показала история, карьера обоих в дальнейшем пошла вниз.
Стар я стал, и многого уже не понимаю как и раньше и многого не понимаю о чем раньше и не подозревал... Так чта не взыщите...
Но как-то подумалось что различные пики больше характеризуют мотивацию или тип психики... Одни Дубровские - отнимают больше у сильных и меньше у слабых. Другие Троекуровы любят грабить бедных.... Мне симпатичнее Дубровские ...
Но как-то подумалось что различные пики больше характеризуют мотивацию или тип психики...
Ну я бы не стал так однозначно... Так или иначе - это проявление силы. А уж мотивация или психика ею управляют, то вопрос другой...
Но ясно, что идеальная гауссиана в качестве силы, коя лежит в основе Эло, далеко не у всех.
У каждого своя специфика. Вот мы ее и наблюдаем
Это несерьезно - максимальный рейтинг Крамника: 2811 (январь 2002).
В момент Мемориала Ботвинника был 2800+ в 2001 году
И вообще этот расчет довольно грубый для производной И не всегда имеется большая статистика на краях диапазона
Но тем не менее мы получаем очень интересные и правдоподобные выводы.
А это главное
Но тем не менее мы получаем очень интересные и правдоподобные выводы.
Считаете, что у Гельфанда больше шансов чем у Каспарова? Даже сейчас в это непросто поверить
Нет, таких выводов мы не сделаем
Схема описывает некий потенциал. Особенно на краях диапазона, где статистика недостаточная.
И показывает лишь, что Борик может сыграть очень хорошо виртуально.
Но основной его класс тем не менее ниже. И именно это и определит результат, ибо на максимуме он играть все время не может.
Иначе имел бы пик выше.
Вообще идея этой, извращенной на первый взгляд, модели очень проста
Если человек, допустим играет все время строго на свое Эло с разными людьми Тогда набранный им % очков будет совпадать с функцией интегральной вероятности примерно
В оригинале у Эло была именно она, но потом ее подкрутили
Производная от нее - это Гауссиана, где пик как раз средняя сила. Чем она круче, тем меньше дисперсия силы игрока.
Все отклонения от Гауссианы и есть различные дисперсии силы, отражающие потенциальные возможности по прыжкам выше головы и ниже попы.
И показывает лишь, что Борик может сыграть очень хорошо виртуально
Хоть Гельфанд и сильный гроссмейстер, но это очевидно не так. 2800 для него возможно лишь в случае, когда первая десятка будет иметь > 2850. Да и каких-то пиков у него не наблюдалось. Рулетка в Казани ниачем
Борик поделил 2-3 место в Мехико с Крамником после Ананда. Выиграл Казань. Сыграл вничью Матч с Анандом
Это результаты не просто первой десятки, а первой тройки
Это более, чем достаточно, чтобы считать Борика способным на многое.
Но он не держит этот уровень всегда, что мы и наблюдаем в нашей модели.
Интересно, что думает о рейтинге ЭЛО почтенный Валерий Борисович. Ведь очевидно, что такие вещи в шахматах просто так не появляются. Значит, масонам и цадикам зачем-то понадобилось ЭЛО-ранжирование шахматистов. Но вот зачем?