генератор случайных чисел колесит всё огромное пространство возможных партий и выдвигает те, что ведут к успеху; такие партии подходят к уже подготовленным наперёд и лучшим эндшпилям, потому не удивительно, что их выигрывают)
Аналогия будет наверное такой, гроссмейстер вместо того, чтобы расчитывать варианты послал кмсов играть тысячу партий в блиц, начиная с текущей позиции. И делает ход, который в партиях кмсов дал наилучший результат. При этом во время обучения сетки еще есть обратная связь, где кмсы становятся умнее узнавая результаты партий, которые они играли в блиц и начинают со временем играть уже как мастера
То есть, нейросеть сама массово доигрывает свои варианты + добавка от Монте-Карло?
То есть, нейросеть сама массово доигрывает свои варианты + добавка от Монте-Карло?
Мы тут в свое время с ув. Владимировичем вроде как прояснили ситуацию. Насколько я помню сеть дает распределение вероятностей победы в партии, для каждого возможного хода в позиции. Монте Карла, используя это распределение, генерит дерево ходов кандидатов. Потом, чтобы оценить позиции, которые возникли на дереве запускаются партии, где сеть сама с собой играет. Таким образом получается эмпирическая вероятность победы и уже дальше выбирается тот ход, который гарантирует самую высокую эмпирическую вероятность победы. При этом у сети появляется возможность сравнить эту эмпирическую вероятность, с тем, что она предсказывала. И если сеть в режиме обучения, то она подкрутит свои веса.
В самом начале сеть просто действительно генерит ходы можно сказать случайно, но дальше ее параметры начинают меняться так, чтобы она точнее предсказывала на основани данной позиции результат партий и она умнеет. Как то так.
Я вот такую аналогию проведу, несколько спорную, но тем не менее...
Таблицы Налимова имеют дело с точными позициями и точными же оценками.
Матрица же нейросетки имеет дело с размытыми позициями и статистическими оценками, т.е. является по сути волновой функцией по сравнению с классической механикой.
Т.е. в предельном переходе это те же таблицы, так же, как уравнение Шредингера в пределе есть уравнение Гамильтона — Якоби
Но вот почему мы должны считать это пониманием? В отличие от?
И почему мы вообще должны считать эти электронные калькуляторы = наборы байтов шахматистами? Способны ли они позвать других шахматистов на дачу на шашлыки и между поеданием шашлыков сыграть пяток партий в быструшки на свежем воздухе и деревянной доске? А обсудить потом перепитии баталий за бокалом вина? А рассказать о новой интересной книжке и поделиться своим мнением о ней? А предложить собеседнику посмотреть партии подающего надежды юниора (юниорки)?
Вряд ли. Это все не шахматисты, это убогие инвалиды. Пусть их поклоняющиеся программам зовут шахматистами.
Но вот почему мы должны считать это пониманием? В отличие от?
Все очень просто, потому что таблица Налимова для начальной позиции огромна, а число параметров в сетке сравнительно мало. Получается, что сеть аппроксимирует таблицы Налимова в пространстве малой размерности. Также как и человек. Самая примитивная человеческая аппроксимация это посчитать материал. Получаем размерность 1 против практически бесконечной размерности таблицы.
P.S.
Так и у гроссов, у каждого своя аппроксимация - со своей размерностью и точностью. И тут получается, что в блице важнее всего чтобы размерность аппроксимации была низкой, так как оценивать десятки факторов времени нет, а в классику большую роль будет играть точность. Из того что Магнус лучше всех играет и в блиц, и в классику, можно предположить, что он очень компактно оценивает позиции и при этом очень точно.
Все очень просто, потому что таблица Налимова для начальной позиции огромна, а число параметров в сетке сравнительно мало. Получается, что сеть аппроксимирует таблицы Налимова в пространстве малой размерности. Также как и человек.
Ну можно назвать это и аппроксимацией, да. Хотя может где-то и не совсем... Мало ли сколько терабайт 5000 TPU наколбасили...
Но ведь человеческое понимание гораздо больше включает равно
И постановку маяков и предвидение будущих позиций (нейросетка же не считает ни на ход, нес па?) и планы по лавированию (поповысиживанию) и много многое другое
Но ведь человеческое понимание гораздо больше включает равно
Практически наверняка человеческое понимание включает гораздо меньше, чем понимание сетки. А что касается предвидения будущих позиций, маяков, то конечно же все это в сети зашито, но только размерность хоть и маленькая по сравнению с таблицей, но все равно на порядки больше размерности человеческого понимания и потому научиться у машины будет трудно. Хотя наверное кое что люди смогут для себя выделить.
Матрица же нейросетки имеет дело с размытыми позициями и статистическими оценками, т.е. является по сути волновой функцией по сравнению с классической механикой. Т.е. в предельном переходе это те же таблицы, так же, как уравнение Шредингера в пределе есть уравнение Гамильтона — Якоби.
Но вот почему мы должны считать это пониманием?
потому что статистические оценки отвечают лучшим/выигрывающим позициям, они лучшие неспроста, в них можно найти все те планы, эвристики, идеи, и даже логику - одним словом понимание - чем гордятся топ гроссы.
а статистические/размытые эти оценки потому, что оставляют место конкретному случайному счёту, что может угробить любое понимание
Как только Вы обыграете альфу, так я сразу с вами и соглашусь. Только чур, Вы играете своей головой, но можете брать хоть час на каждый ход. Ну а если серьезно, то какова размернорсть компонентов, на которые человек обращает внимание?
А в пределе мы получаем таблицы Налимова, вот и все
Это посто не так. Аналогия не катит совершенно. Сеть не запоминает, как нужно ходить в каждой возможной позиции. Она даже никогда не видела 99.99999% процентов позиций, тем не менее научилась их точно оценивать и находить оптимальную стратегию, что свидетельствует о понимании.
Практически наверняка человеческое понимание включает гораздо меньше, чем понимание сетки
Зато у нейросетки отсутствует логическое мышление. Новые, не встречавшиеся ранее идеи никак не могут быть подняты, а человек может что-то предложить даже в совершенно неизведанном положении.
Тогда уж давайте и отрежем ей ноги и не дадим использовать МонтеКарлу.
Чтобы она не считала миллион позиций. Я столько не успеваю
На личессе есть самодельный бот, где умелец натренировал сетку играть против стока на каком то смехотворном по сравнению с альфой числе партий. Так вот этот бот смотрит только 30 позиций в секунду, что в принципе уже сопоставимо с человеком. Рейтинг у бота 2400.
Зато у нейросетки отсутствует логическое мышление. Новые, не встречавшиеся ранее идеи никак не могут быть подняты, а человек может что-то предложить даже в совершенно неизведанном положении.
Частично Вы правы. Если тип позиций не встречался совсем во время тренировок сети, например не встречались ладейники, то сеть скорее всего будет выдавать плохие ходы. С другой стороны на примере Пономарева мы видим, что человек даже играя ладейники не может легко обобщить свой опыт.
Она дает волновую функцию для набора состояний, то бишь спектр.
Очень точная аналогия
Это какие то очень общие слова. Волновую функцию каких состояний она дает? Если Вы скажите, состояний таблицы, то это очевидно не так, и аналогия не катит.
интересно когда и как альфа считает, ведь нельзя совсем без счёта обойтись, АТО грубо зевнёшь
Сеть не считает ничего. Сеть выдает вероятность победы в партии без счета от слова совсем. Монте Карла чисто технически тоже ничего не считает, просто тупо разыгрывает партии сама с собой.
Это какие то очень общие слова. Волновую функцию каких состояний она дает? Если Вы скажите, состояний таблицы, то это очевидно не так, и аналогия не катит.
Состояний позиций очевидно.
Странно, что Вы аналогию не улавливаете
Зато у нейросетки отсутствует логическое мышление. Новые, не встречавшиеся ранее идеи никак не могут быть подняты, а человек может что-то предложить даже в совершенно неизведанном положении.
полагаю, что с помощью Монте Карла сетка может заглядывать везде в огромнейшем пространстве игры, а типов/классов позиций может не так много, позиции похожи друг на друга, так шта...