Гамильтониан
Координаты фигур как обобщенные координаты
Возможные ходы, как обобщенные импульсы
Ну и где в такой формулировке связь между волновой функцией и вероятностью победы в партии? Волновая функция дает распределение вероятности того где на самом деле находится частица, а фигуры у нас слава богу по доске не размазаны. Не вижу пока никакой аналогии.
Вроде должен помнить и конкретно указал на место, которое мне непонятно в Ваших рассуждениях. Может это Вы забыли распределение вероятности чего она представляет?
Человек вообще существо особое. Он может махнуть винца, к примеру, и тогда...
Ну если винцо хорошее, то оно должно усиливать творческую компоненту игры (при правильной дозировке), а если плохое, то будет оказывать отупляющие воздействие и вести к поражению.
то бишь перед каждым ходом альфа ныряет в умопомрачительное число партий с самой собой от текущей позиции?
Давайте попробую еще раз на пальцах объяснить. Альфа состоит из двух компонент. Первая это Монте Карло поиск по дереву, а вторая это нейросеть. Нейросеть может глядя на позицию без всякого счета выдать вероятность победы после каждого возможного хода. Что то вроде гроссмейстера, который только из общих соображений оценивает позицию. Но Монте Карла вместо того, чтобы верить гроссу на слово, начинает разыгрывать партии сама с собой. Ходы в партиях опять же делает гросс-нейросетка ничего не считая, а просто делает наилучшие навскидку ходы. После этого Монте Карла, смотрит, а какая же на самом деле вероятность оказалась выиграть партию для данного хода и уже таким образом выбирает ход, который будет делать.
Если сеть работает в режиме обучения, то Монте Карло даст пинка гроссу если его предсказания отличались от эмпирических результатов, а в противном случае наградит его пряником. Гросс-нейросетка от этого постепенно набирается ума.
В результате сеть учится очень хорошо предсказывать конечный результат партии только по позиции и без всякого счета. Как следствие она может сказать например, какой дебютный вариант самый лучший и более того может сама открыть этот дебютный вариант.
Вроде должен помнить и конкретно указал на место, которое мне непонятно в Ваших рассуждениях. Может это Вы забыли распределение вероятности чего она представляет?
Вероятность числового результата на пространстве ходов в данной позиции. Я вот не понимаю, что именно непонятно
Вам бы философские трактаты писать. Звучит все очень красиво и наукообразно конечно, но только чтобы аналогия работала, нужна не вероятность абы какого результата а конкретно вероятность нахождения частицы в какой то области пространства. Частица у Вас что, фигура на доске?
P.S.
С праздником кстати
Звучит все очень красиво и наукообразно конечно, но только чтобы аналогия работала, нужна не вероятность абы какого результата а конкретно вероятность нахождения частицы в какой то области пространства. Частица у Вас что, фигура на доске?
В самом общем случае Гамильтониан и волновая функция в уравнении Шредингера суть функции от обобщенных координат и импульсов
Координаты есть координаты фигур и пешек, обобщенные импульсы - ходы.
Все.
В самом общем случае Гамильтониан и волновая функция в уравнении Шредингера суть функции от обобщенных координат и импульсов
Остается только понять Гамильтониан чего. Если Гамильтониан позиции, то волновую функцию никак нельзя интерпретировать, как вероятность победы. А в вашей свободной, я бы даже сказал философской, интерпретации и человеческое понимание в пределе есть таблица Налимова.
Интересную идею предложил ув. Александр, который подметил, что сеть все равно не обладает логикой. Вот тут видимо надо искать какие то отличия человеческого понимания от понимания сети.
Легко.
Гамильтониан в данной интерепретации есть некая весовая функция(оператор) от позиции и возможных ходов, содержащая дерево расчета\знаний
Волновая функция - вероятности результата на пространстве ходов
Аналог постоянной Планка в шахматном Шредингере определяет уровень "табличности" по сути
Когда Планка -> 0 , то вероятности превращаются в строгое знание\расчет, т.е мы имеем таблицы Налимова\классическую механику
когда Планка -> ∞, то мы стремимся к чистому пониманию при отсутствии расчета, то бишь это человек по минуте условно (хотя что-то все равно считается)
А вообще Вы опять доводите до абсурда в целом понятную аналогию, которая естественно не претендует на абсолютно точную модель.
Это некоторая абстракция.
Энергия системы (позиции) тут не сохраняется (это обобщенное дерево вариантов), но также имеет потенциальную(статическую) и кинетическую(динамическую) составляющие, также как и гамильтониан, и зависит от обобщенных координат и импульсов.
Имеет место предельный случай - точное знание\расчет - Налимов. Тогда множество вероятностей результата для ходов позиции становится строго дискретным 1, 1\2, 0, при этом и позиция должна быть задана абсолютно точно.
Увеличение Планки приводит к тому, что позиция размазывается (скажем слоями нейросетки) в ключевые кластеры, а множество вероятностей результата становится непрерывной функцией.
Планка же не константа в целом, точнее константа только для конкретного субъекта-игрока в конкретных условиях и то неточно.
А вообще Вы опять доводите до абсурда в целом понятную аналогию, которая естественно не претендует на абсолютно точную модель.
Аналогия совершенно непонятная. Если гамильтониан позиции, то волновая функция будет описывать вероятность местоположения фигур, а не исхода партии. Мне больше нравится другая аналогия. Человеку на вход подают картинку с позицией, которую наш мозг преобразует в ходы кандидаты (которые надо посчитать, но сами кандидаты возникают без счета) и первоначальную оценку. И нейросеть на вход получает картинку, которую она ровна как и человек преобразует и выдает на выходе всю ту же оценку и все те же ходы кандидаты. Человек и нейросеть выделяют из позиции ключевые кластеры, только у нейросетки этих кластеров и позиционных нюансов больше чем даже у Магнуса на несколько порядков, вот и вся разница.
Вот например эта кустарная нейросетка смотрит только 30 ходов в секунду lichess.org/@/AntiFish-Mk289
Попробуйте с ней сыграть, будет интересно услышать Ваше мнение об уровне игры.
Интересную идею предложил ув. Александр, который подметил, что сеть все равно не обладает логикой. Вот тут видимо надо искать какие то отличия человеческого понимания от понимания сети.
Возвращаясь к интересной идее ув. Александра, можно сравнить обученную сетку с человеческой интуицией. Она тоже строится на каких-то фрагментах, нюансах и прочих казалось бы малозначимых или даже странных мелочах. И человек особенно в эндшпиле может направить свою интуицию в логическое русло решаемых задач типа "цель - средства". Например, понимая необходимость пешечного прорыва, точнее почувствовать подходящий для него момент. Ну, и многие другие примеры, приходящие в голову.
То есть, видимо нейросеть еще можно усилить логикой. Да так усилить, что у фанатов понимания не останется ровно ни одного самого завалящего аргумента
Умею, просто я в отличие от Вас физикой когда то занимался и КМ изучал плотно. Поэтому и вижу неустранимые дыры в вашей аналогии.
Да? Может и ученую степень по физике имеете, как у меня?
Судя по Вашим воплям, Ваша идея только в том, чтобы мне возразить, доведя все до абсурда и придираясь по мелочам
Абстрактного мышления и фантазии в Вас нет ни на грамм
Альфа состоит из двух компонент. Первая это Монте Карло поиск по дереву, а вторая это нейросеть. Нейросеть может глядя на позицию без всякого счета выдать вероятность победы после каждого возможного хода. Что то вроде гроссмейстера, который только из общих соображений оценивает позицию. Но Монте Карла вместо того, чтобы верить гроссу на слово, начинает разыгрывать партии сама с собой. Ходы в партиях опять же делает гросс-нейросетка ничего не считая, а просто делает наилучшие навскидку ходы. После этого Монте Карла, смотрит, а какая же на самом деле вероятность оказалась выиграть партию для данного хода и уже таким образом выбирает ход, который будет делать.
Если сеть работает в режиме обучения, то Монте Карло даст пинка гроссу если его предсказания отличались от эмпирических результатов, а в противном случае наградит его пряником. Гросс-нейросетка от этого постепенно набирается ума.
В результате сеть учится очень хорошо предсказывать конечный результат партии только по позиции и без всякого счета. Как следствие она может сказать например, какой дебютный вариант самый лучший и более того может сама открыть этот дебютный вариант.
ага, так и думал, что Монте Карло перед очередным ходом вполне может заменить счёт, поскольку с очень большой (!) вероятностью прощупывает ближайшую тактику и застукивает подводные камни с зевками ; ясно было, конечно, что сетка выдвигает ходы сразу, без всякого счёта и на базе прошлого самообучения (тем же Монте Карлом), но как-то не продолжил эту линию до конца: Альфа всё время делает одно и то же - гонит Монте-Карло - может менее интесивный/громоздкий во время официальных партии, дабы уложиться в контроль времени.
если захочет, Альфа может исползовать такие партии (НЕ с самой собой) для дальнейшего самообучения путём подставления только-что найденных Монте-Карлом эмпирических частот исходов партий самой с собой вместо прежних вероятностных настроек сетки