Ключевое слово
09 | 12 | 2024
Новости Библиотеки
Шахматы Онлайн
Welcome, Guest
Username: Password: Remember me

TOPIC: АльфаЗеро и Толстый Фриц. Нейросети.

АльфаЗеро и Толстый Фриц. Нейросети. 27 Нояб 2019 16:41 #1

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Сим мы тут продолжим дискуссии, накопившиеся во многих турнирных темах и мешающие там одноглазым любителям обсуждать блондинов, играющих хорошо, и брюнетов, играющих плохо, а также переводы слонов в испанской партии с b5 на c4 :)
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 27 Нояб 2019 17:49 #2

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 36502
  • Thank you received: 825
  • Karma: 58
Fat Fritz это может Жирный Фриц?

Ссылочка на описательную статью с Chessbase
en.chessbase.com/post/fat-fritz-what-on-earth-is-that
Fat Fritz was tested by some of the best players in the world, who expressed unmitigated delight over the ideas and improvements it came up with. Now the program is publicly available on the ChessBase Engine Cloud.
Last Edit: 27 Нояб 2019 17:50 by Ruslan73.

АльфаЗеро и Толстый Фриц. Нейросети. 27 Нояб 2019 18:17 #3

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Ruslan73 wrote:
Fat Fritz это может Жирный Фриц?
Ну можно и так перевести
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 02:49 #4

  • PP
  • PP's Avatar
  • OFFLINE
  • Холоп
  • Posts: 31409
  • Thank you received: 224
  • Karma: -124
Крамник дорвался до альфазеро и теперь предлагает отменить рокировку
www.chess.com/article/view/no-castling-chess-kramnik-alphazero

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 03:36 #5

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
странно видеть ув. РР ссылаться на не долюбливаемого Крамника :dontknow:

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 04:36 #6

  • PP
  • PP's Avatar
  • OFFLINE
  • Холоп
  • Posts: 31409
  • Thank you received: 224
  • Karma: -124
Хайдук wrote:
странно видеть ув. РР ссылаться
Я не ссылаться, я новостью делюсь. Матчевый чемпион хочет отменить рокировку!

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 05:15 #7

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
а что, разве это плохо?
Last Edit: 28 Нояб 2019 05:20 by Хайдук.

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 05:39 #8

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Вы, ув.Хайдук нам хотели теоретический вклад внести :glasses:
:beer:
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 12:47 #9

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
думал перенести сюда дискуссию с турнирной темы и зачитать заново.

там скаляр был оценкой всей позиции, а вектор состоял из вероятностей лучших, самых перспективных ходов на базе скалярной оценки или как? :glasses:

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 14:32 #10

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Хайдук wrote:
думал перенести сюда дискуссию с турнирной темы и зачитать заново.
Ну переносить уж поздно наверно
Скопируйте интересное :)
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 28 Нояб 2019 16:22 #11

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Вот текст из статьи, что вход и что выход
This neural network takes the board position s as an input and outputs a vector of move probabilities p with components pa = P r(a|s)
for each action a, and a scalar value v estimating the expected outcome z from position s,
v ≈ E[z|s]. AlphaZero learns these move probabilities and value estimates entirely from selfplay; these are then used to guide its search.

Т.е компоненты вектора выхода это вероятности каждого хода плюс дополнительный скаляр - итоговая оценка позиции
Все это скармливается следующему звену пищевой цепочки - алгоритму поиска по дереву ходов, который там монтекарла Monte-Carlo tree search (MCTS) algorithm

MCTS возвращает The search returns a vector π representing a probability distribution over moves

Вот как-то так там написано.
Понятно, что какие то другие разработчики могли бы построить сеть иначе

Сама статья
arxiv.org/abs/1712.01815
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 30 Нояб 2019 14:02 #12

  • sovaz1997
  • sovaz1997's Avatar
  • OFFLINE
  • Отрок
  • Posts: 1
  • Karma: 0
Не могу не отметить, что Fat Fritz является всего лишь более слабой версией Leela Chess Zero (Lc0). Это очень немаловажный факт. Fat Fritz - по сути, клон Лилы, но со нейронная сеть со своими весами.

АльфаЗеро и Толстый Фриц. Нейросети. 30 Нояб 2019 14:45 #13

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Лила с Воблой играют почти на равных.
Значит, Фат Фриц тоже пиар-акция :glasses:
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 01 Дек 2019 07:36 #14

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Пока ув.Хайдук думает над теоретическим вкладом, приведем ссылки на предыдущие дискуссии (переносить их сюда уже затруднительно, да и не нужно, в них много эмоций :))

quantoforum.ru/arena/250-shakhmatnyj-ter...i-1?start=780#469186
quantoforum.ru/arena/2934-tekushchie-turniry-2?start=150#446011
Появился какой-то Жирный Фриц.
quantoforum.ru/lab/1893-samyj-krutoj-sha...zhok?start=60#475410
quantoforum.ru/arena/2934-tekushchie-turniry-2?start=480#477829
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 07 Дек 2019 15:33 #15

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
похоже, что вектор перспективных/лучших ходов определяется на базе оценки ресурсов всей (!) позиции и потом этот вектор прочёсывается счётом (не важно Монте-Карло или другим способом) на вшивость; не ясно когда счёт прерывают дабы посмотреть на оценку текущей позиции, может возвращаются к проверке счётом следующего хода вектора, дабы в конце концов сравнить оценки получающихся позиций и выбрать лучшую, то бишь лучший ход в векторе к ней приведший :unsure:

АльфаЗеро и Толстый Фриц. Нейросети. 07 Дек 2019 17:07 #16

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Ув.РР на Вас нет :)
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 07 Дек 2019 17:58 #17

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
почему? :)

АльфаЗеро и Толстый Фриц. Нейросети. 07 Дек 2019 18:45 #18

  • PP
  • PP's Avatar
  • OFFLINE
  • Холоп
  • Posts: 31409
  • Thank you received: 224
  • Karma: -124
Vladimirovich wrote:
Ув.РР на Вас нет
Вот специально для ув Хайдука ссылочка, там все на популярном уровне обьясняется
deepmind.com/blog/article/alphago-zero-starting-scratch

АльфаЗеро и Толстый Фриц. Нейросети. 07 Дек 2019 19:21 #19

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
ясно, что нейросеть строит вектор желанных ходов на базе глобальных позиционных оценок выработанных/накопленных в результате самообучения; детали могут быть разными, но безусловно заслуживают ярлыка «понимание» :yess:

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 05:43 #20

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Ярлыки можно вешать любые :)
Важно понимать суть вещей
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 05:43 #21

  • ))
  • ))'s Avatar
а мне ясно, что человеческая нейросеть для чемпионской игры в го должна быть генетически сходной с японской, а для игры в шахматы - с еврейской; последнее верно и для математики тоже, что может означать контингентность (случайность) современной математики в целом

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 05:48 #22

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
самоед, это ты сморозил эту ахинею? :(
Last Edit: 08 Дек 2019 05:49 by Хайдук.

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 06:14 #23

  • ))
  • ))'s Avatar
не ахинея, а вполне законченная мысель

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 06:19 #24

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 36502
  • Thank you received: 825
  • Karma: 58
В Го всех сильнее играют корейцы.

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 06:26 #25

  • ))
  • ))'s Avatar
ну, значит, мысель надо чуток подправить (я-то в го не умею совсем)

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 06:33 #26

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Собссно, и евреи не самые сильные в шахматах... :) Были лишь периоды...

И изобрели шахматы индусы (и арабы)...
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 07:27 #27

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
Vladimirovich wrote:
Ярлыки можно вешать любые :)
Важно понимать суть вещей
суть вещь скользкая как рыба...

понимание гроссов основываем на том, что можно провезти некоторый план/стратегию почти наверняка, нечему в позиции помешать проведению плана и это можно доказать почти логически; «почти» в случае означает, что в большинстве случаев план нужно всё-таки проверить счётом и, конечно, иногда плана не станет, счёт его обрушит.

подобным образом нейросеть «чуёт», что позиция требует некоторых вероятных ходов, которые стоит проверить счётом не обманывают ли её насчёт своей «почти» видимой (на базе прежнего опыта самообучения), но не гарантированной перспективности; не надо исключать того, что может нейросеть нащупывает стратегии, которые могут оказаться совершенно недоступными и не понятными башке гроссов :dumb:
Last Edit: 08 Дек 2019 07:37 by Хайдук.

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 07:35 #28

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 109798
  • Thank you received: 2227
  • Karma: 108
Хайдук wrote:
понимание гроссов основываем на том, что можно провезти некоторый план/стратегию почти наверняка
Хайдук wrote:
подобным образом нейросеть «чуёт», что позиция требует некоторых вероятных ходов, которые стоит проверить счётом

Это верно отчасти...

Но дело в том, что построение плана человеком на порядок более гибко, чем даже Альфой, не говоря уже о хардкорных движках.
Понимание (настоящее, человеческое) не сводится только лишь к быстрому нахождению ближайших хороших ходов.
Планы могут быть гораздо сложнее и изощреннее, а построенные ментально графы ходов могут быть не обязательно банальным деревом.

Нейросетка демонстрирует нам некое базовое понимание уровня второго разряда, как показывают все примеры от ув.РР
Все остальное считает монтекарла.
И этого оказывается достаточно, чтобы всех громить.

Но этого мало, чтобы говорить о реальном понимании.
Каждому - своё.

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 08:02 #29

  • ))
  • ))'s Avatar
Vladimirovich wrote:
И изобрели шахматы индусы (и арабы)...

И что? Пишут, что перегонный куб тоже арабы изобрели (или персы).

АльфаЗеро и Толстый Фриц. Нейросети. 08 Дек 2019 08:09 #30

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 49565
  • Thank you received: 133
  • Karma: 17
Vladimirovich wrote:
Планы могут быть гораздо сложнее и изощреннее, а построенные ментально графы ходов могут быть не обязательно банальным деревом.
но если с пробоинами и значит не реализуемые, то какого толку в них?

кто-то догадался предлагать компам и альфе типичные позиции на людское понимание? до каких пор будем отмазываться «неизбежными» дальнейшими ошибками даже в таких позициях с нашим же пониманием? :angry:
Moderators: Vladimirovich, Ruslan73
Рейтинг@Mail.ru

Научно-шахматный клуб КвантоФорум