Ключевое слово
16 | 12 | 2018
Новости Библиотеки

Шахматы онлайн

Чессбомб

Welcome, Guest
Username: Password: Remember me

TOPIC: Искусственный Интеллект

Искусственный Интеллект 12 Дек 2017 21:59 #331

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Хайдук wrote:
не думаю, что гроссы высокого мнения об оценках позиций воблой, не за это её любят
Может и не любят, но в конечном итоге доверяют ей, почти как господу богу.

Искусственный Интеллект 12 Дек 2017 23:58 #332

  • onedrey
  • onedrey's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23193
  • Thank you received: 795
  • Karma: 2
Open letter to Google DeepMind
Dear Sirs,
Please let me congratulate you on your amazing achievement in developing AlphaZero chess! As someone who completed a thesis in neural networks back in the 90's, I could not be more amazed at how far you have been able to advance the field.

I can't speak for the entire Stockfish team so I simply speak as one of its open source contributors. If you read other posts on this forum or talkchess.com however you may find that what I'm about to point out may mirror the sentiment of others in the computer chess community as well.

AlphaZero won the 100 game match against Stockfish very impressively by a total score of 28 wins and 72 draws and 0 loses. This translates to an Elo difference of 100. However the details of the match described in your paper show that this match might have been much closer and more interesting had it not been for some IMO rather unfair conditions. These might not be immediately obvious even to those using chess engines on a regular basis.

1) In the match version 8 of Stockfish was used which is now over a year old. The latest version of Stockfish is over 40 Elo stronger in fast self play.
tests.stockfishchess.org/tests/view/5a23e7c10ebc590ccbb8b6d8
When consulted the Stockfish team always enters the latest version into serious competition such as TCEC.

2) The 1GB amount of memory used for the hash table on a 64 core machine with 1 minute per move is sorely inadequate. Stockfish displays the % of hash used so anyone can see how quickly it fills up. An reasonable amount of memory would likely have been around 16 times more at 16GB. The reason this is especially critical with many threads is because Stockfish uses the hash as the main mechanism through which all threads communicate(aka Lazy SMP). It is almost certain that this resulted in another significant Elo reduction in Stockfish.

3) Much effort has been put into making Stockfish understand which positions are critical and which are not. Based on this Stockfish manages its clock very carefully spending significantly more time on some positions during a game and very little on others. Disabling this feature and forcing Stockfish to use its time based on your same 1 minute for every move time control results in yet another large Elo reduction.

Since the Stockfish team wasn't contacted prior to the match I believe the issues outlined above were simply a result of unfamiliarity with the Stockfish engine. With the above issues corrected the 100 Elo gap should change quite significantly. I believe you are interested in a fair match more than winning and it is therefore my hope that a second proper rematch can be played for the benefit of both scientific research as well as the chess community. I wish to thank you for the tremendous contribution you have made to computer chess with a completely novel approach and hope that Stockfish has been a useful competitor for your testing. Please don't hesitate to contact myself or the Stockfish team in the future. We are your fans.

Sincerely
Michael Stembera(Fisherman)
Michael Stembera is altogether too polite and cautious.

A 64-core system should have had NO LESS than 64GB of hash memory and preferably 128GB. This is especially true when you consider the time management question. Perhaps at one minute per move 64GB would be very adequate, but if the engine was not limited to one minute and needed a deep think of several minutes it could conceivably fill 128GB.

Michael forgot to mention that Stockfish would have benefited from six-man endgame tablebases, something that available to all of the top engines and vitally important at the top levels of competition.

Michael forgot to mention that Stockfish did not benefit from any sort of opening book, thereby wasting time in the early part of the game. Considering that Alpha Zero trained itself though 44 million test games not giving an opponent the courtesy to benefit from all that has been developed over the years is yet another handicap.

It is also not known what settings were used in the test, particularly pertaining to contempt.

In short, this "match" was like a boxing match where one fighter had no seconds in his corner, the referee and judges were picked by his opponent, there was no audience to validate what happened in the ring as it happened, and the post-match story was written by the opponent's hirelings. It may well be that Alpha Zero is indeed better than the latest version of Stockfish in fair test conditions. But it is almost criminal to announce very biased test results such as these, thereby rubbishing the work of hundreds of people, in order to gain some PR benefit. What the computer chess community expects is fairness and decency.

Incidentally, TCEC's current champion is Houdini 6.03.

Nelson Hernandez, TCEC
Ну да, эти люди, россияне, и являются стадом баранов.
Last Edit: 13 Дек 2017 00:05 by onedrey.

Искусственный Интеллект 13 Дек 2017 00:06 #333

  • Хайдук
  • Хайдук's Avatar
  • NOW ONLINE
  • Посадник
  • Posts: 34093
  • Thank you received: 74
  • Karma: 22
PP wrote:
Хайдук wrote:
не думаю, что гроссы высокого мнения об оценках позиций воблой, не за это её любят
Может и не любят, но в конечном итоге доверяют ей, почти как господу богу.

не во всех позициях доверяют (вот ув. Владимирович частенько ругает воблу), только в сумбурных/сельскохозяйственных (которых большинство, к сожалению) обращаются к ней за помощь счётом; отдельные позиции, которые понимают, могут держать против воблы, но при затянувшейся игре начинают брешить, потому что игра проходит через позиции, в которых мало (людского, то бишь) понимания и много сумбурного счёта, где гроссы уступают вобле и значит неизбежно сплохуют :(
Last Edit: 13 Дек 2017 01:06 by Хайдук.

Искусственный Интеллект 13 Дек 2017 04:12 #334

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Ребята хотят реванша. С научной точки зрения это уже неинтересно. Понятно, что произошёл качественный скачок. Научный интерес имхо представляет матч Альфы против человека с компом, чтобы сравнить человеческое понимание с понимание нейросети. Лучшего кандидата чем Карлсен, с его гениальным пониманием, имхо не найти.

Искусственный Интеллект 13 Дек 2017 05:52 #335

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
Лучшего кандидата чем Карлсен, с его гениальным пониманием, имхо не найти.
Ну эт вряд ли...
Лучший это Вишик. Он на компах три собаки сожрал...
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 06:28 #336

  • Alexander
  • Alexander's Avatar
  • OFFLINE
  • Боярин
  • Posts: 10151
  • Thank you received: 103
  • Karma: 11
PP wrote:
Ребята хотят реванша. С научной точки зрения это уже неинтересно. Понятно, что произошёл качественный скачок.

Вот и интересно посмотреть против Стокфиша на быстром железе с правильными настройками, так ли уж далек и в какую сторону этот качественный скачок :)

Искусственный Интеллект 13 Дек 2017 07:00 #337

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
Лучший это Вишик. Он на компах три собаки сожрал...
Ну пусть будет Вишик.

Искусственный Интеллект 13 Дек 2017 07:09 #338

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Alexander wrote:
Вот и интересно посмотреть против Стокфиша на быстром железе с правильными настройками, так ли уж далек и в какую сторону этот качественный скачок
Качественный скачок в том, что прога самообучилась. А уж насколько она лучше Стока уже не принципиально, ясно что этот алгоритм можно развивать и дальше. Не забудьте, что ее даже под шахматы не затачивали, тот же самый алгоритм научился играть в Го и Сеги. Плюс стиль игры совсем не компьютерный, позиционные жертвы на стратегическую инициативу. :flag:

Искусственный Интеллект 13 Дек 2017 07:36 #339

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
Качественный скачок в том, что прога самообучилась.
Интересна степень этого "само"
Кто делал архитектуру нейросетки, кто ее адаптировал к реалиям, кто скармливал ей партии...
Потому что, извините, я не могу поверить в бред, что прога начала со всех возможных ходов и создала все дебюты с миттельшпилем и далее за 4 часа
Ввиду известного количества возможного (см. древнюю притчу о создателе шахмат, шахе и мешках зерна)

Это возможно для гарднеровской игры три на три пешки, где достаточно и спичечного коробка с шариками
quantoforum.ru/mathematics/2243-iskusstv...ekt?start=150#413572

Но шахматы и го не тот случай.
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 07:43 #340

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
Ну пусть будет Вишик.
У Вишика есть понимание. Он у нас Альфа-самец
А У Карлсена гудини в голове :figa:
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 08:07 #341

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
Кто делал архитектуру нейросетки, кто ее адаптировал к реалиям, кто скармливал ей партии...
Исчо раз, партии ей никто не скармливал. Она играя сама с собой создала фактически шахматную дебютную теорию!Vladimirovich wrote:
Кто делал архитектуру нейросетки
Китайце, кто же еще :) Не думаю кстати, что они выдумали что то особенное. Скорее всего в многослойный перцептрон все засунули.Vladimirovich wrote:
Потому что, извините, я не могу поверить в бред, что прога начала со всех возможных ходов и создала все дебюты с миттельшпилем и далее за 4 часа
Теория эволюции в действии! Там ведь можно сказать что генетический алгоритм работает, когда на каждой итерации выбирают самого сильного игрока. Статья есть, в ней есть метод. Этот результат наверняка воспроизведут, не унывайте. :flag:

Искусственный Интеллект 13 Дек 2017 08:08 #342

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
У Вишика есть понимание. Он у нас Альфа-самец
Вот и отлично. Проверим у кого он круче, у АльфыЗеро или АльфаСамца. :)

Искусственный Интеллект 13 Дек 2017 08:34 #343

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
Она играя сама с собой создала фактически шахматную дебютную теорию!
Это невозможно из количественных соображений
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 10:26 #344

  • onedrey
  • onedrey's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23193
  • Thank you received: 795
  • Karma: 2
Vladimirovich wrote:
Лучший это Вишик. Он на компах три собаки сожрал...

Три белых коня
Ну да, эти люди, россияне, и являются стадом баранов.

Искусственный Интеллект 13 Дек 2017 14:32 #345

  • Hornet
  • Hornet's Avatar
  • OFFLINE
  • Печатник
  • Posts: 238
  • Thank you received: 1
  • Karma: 1
Alexander wrote:
Вот и интересно посмотреть против Стокфиша на быстром железе с правильными настройками
Как Вы не поймёте - не настройки надо менять, алгоритм стока надо менять :dumb: (простите смайлик чересчур резок, не совсем подходит под ситуацию). В посте № 193 уже писал про глубину расчёта.
Last Edit: 13 Дек 2017 14:33 by Hornet.

Искусственный Интеллект 13 Дек 2017 15:28 #346

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
Это невозможно из количественных соображений
Не вижу почему. Альфа научился генерировать разумные ходы кандидаты и оценивать вероятность победы на основе позиции, вот эмпирически и отсек непродуктивные дебютные идеи.

Искусственный Интеллект 13 Дек 2017 15:39 #347

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
ННе вижу почему. Альфа научился генерировать разумные ходы кандидаты и оценивать вероятность победы на основе позиции, вот эмпирически и отсек непродуктивные дебютные идеи.
На каком основании он научился?

Значит его научили, как отсеивать. С нуля это невозможно. Слишком большое число вариантов
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 17:50 #348

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
На каком основании он научился?
Вы хотите сказать, что нельзя начав с какого то случайного набора параметров методом оптимизации найти набор параметров близкий к оптимальному? :glasses:Vladimirovich wrote:
С нуля это невозможно. Слишком большое число вариантов
Ну люди ведь как то справились, хоть и за чуть больший срок. Как и человек, Альфа Зеро ведь не перебирает тупо все возможные позиции.
In AlphaGo Zero, self-play games were generated by the best player from all previous iterations. After each iteration of training, the performance of the new player was measured against the best player; if it won by a margin of 55% then it replaced the best player and self-play games were subsequently generated by this new player. In contrast, AlphaZero simply maintains a single neural network that is updated continually, rather than waiting for an iteration to complete. Self-play games are generated by using the latest parameters for this neural network, omitting the evaluation step and the selection of best player.
Сеть предсказывает исход партии исходя из позиции. Проводится игра самим с собой умной монтекарлой, игра дает результат. На основании этого результата параметры сети меняются. В какой то момент алгоритм сходится и мы получаем самоорганизацию понимания.
Last Edit: 13 Дек 2017 17:52 by PP.

Искусственный Интеллект 13 Дек 2017 18:55 #349

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
Вы хотите сказать, что нельзя начав с какого то случайного набора параметров методом оптимизации найти набор параметров близкий к оптимальному?
Нет. Задача нахождения глобального экстремума точно неразрешима :)
PP wrote:
Ну люди ведь как то справились, хоть и за чуть больший срок. Как и человек, Альфа Зеро ведь не перебирает тупо все возможные позиции.
Правильно. Ей скормили лучшие образцы для подражания.
Так и настраивается нейросетка.
PP wrote:
Сеть предсказывает исход партии исходя из позиции. Проводится игра самим с собой умной монтекарлой, игра дает результат.
Вы сделали из монтекарлы фетиш
quantoforum.ru/mathematics/2243-iskusstv...ekt?start=300#414096
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 19:01 #350

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
Нет. Задача нахождения глобального экстремума точно неразрешима
Глобальный и не нужен, они же не теорию правды строят.Vladimirovich wrote:
Правильно. Ей скормили лучшие образцы для подражания.
Если Вы не знакомы с методом, это еще не повод обвинять авторов в фальсификациях.
:beer:

Искусственный Интеллект 13 Дек 2017 19:10 #351

  • Alexander
  • Alexander's Avatar
  • OFFLINE
  • Боярин
  • Posts: 10151
  • Thank you received: 103
  • Karma: 11
Hornet wrote:
Как Вы не поймёте - не настройки надо менять, алгоритм стока надо менять :dumb: (простите смайлик чересчур резок, не совсем подходит под ситуацию). В посте № 193 уже писал про глубину расчёта.

Да я согласен и насчет алгоритма, и в особенности насчет стиля - он у Альфы очень привлекательный, ближе всего Бронштейн с его Давидом против Голиафа. Меня-то другое интересует, насчет истины, насколько такой стиль выдерживает проверку минимаксом с поиском явных опровержений. Философский вопрос, можно сказать :)

Искусственный Интеллект 13 Дек 2017 19:26 #352

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
PP wrote:
Если Вы не знакомы с методом, это еще не повод обвинять авторов в фальсификациях.
:rain:
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 20:03 #353

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
argumenti.ru/talks/2017/12/558210?typelink=openlink
«ОКОНЧАТЕЛЬНОЕ прощай человеку» – так шахматные эксперты прокомментировали случившееся. Нейросеть AlphaZero всего за четыре часа научилась безупречно играть в шахматы и наголову разгромила самый лучший шахматный компьютер. «Ему здорово досталось, он был сметён с поля. AlphaZero учится на собственных партиях и всё время остаётся сильнейшей», – утверждают специалисты. Теперь машины будут побеждать человека в 100 случаях из 100.

Впрочем, не всё так просто. Критики утверждают, что соперники находились в неравных условиях. Во-первых, у компьютера была уменьшена мощность и до неприличия обрезана память. Во-вторых, нейросеть AlphaZero играла дебюты, которые были заранее выбраны как «лучшие» для неё. Компьютер же играл с нуля, то есть без дебютной книги. Однако преимущество новой системы было настолько велико, что данные аргументы имеют право на жизнь лишь отчасти. Искусственный интеллект просчитывал за секунду в несколько тысяч раз меньше ходов, чем компьютер, и тем не менее выиграл со счётом 28:0.
Каждому - своё.

Искусственный Интеллект 13 Дек 2017 23:29 #354

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
Vladimirovich wrote:
и до неприличия обрезана память.
Обряд обрезания указывает на ритуальный характер матча.

Искусственный Интеллект 13 Дек 2017 23:43 #355

  • onedrey
  • onedrey's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23193
  • Thank you received: 795
  • Karma: 2
Да ладно, если бы та Альфа играла не на 4-х TPU, а на одном, она сыграла бы уже вничью. 80-100 пунктов как раз соответствует учетверению мощности. И это учитывая, что по дебюту Стокфиш практически гарантированно получал сильно хуже черными, а белыми в лучшем случае равенство - и все равно умудрялся выкарабкиваться в большинстве случаев, то есть в самостоятельной игре "за доской" де факто переигрывал, или, во всяком случае, не уступал
Ну да, эти люди, россияне, и являются стадом баранов.

Искусственный Интеллект 14 Дек 2017 02:25 #356

  • Хайдук
  • Хайдук's Avatar
  • NOW ONLINE
  • Посадник
  • Posts: 34093
  • Thank you received: 74
  • Karma: 22
PP wrote:
Сеть предсказывает исход партии исходя из позиции. Проводится игра самим с собой умной монтекарлой, игра дает результат. На основании этого результата параметры сети меняются. В какой то момент алгоритм сходится и мы получаем самоорганизацию понимания.
угу, нечто такое происходит :yess:

Искусственный Интеллект 14 Дек 2017 02:33 #357

  • Хайдук
  • Хайдук's Avatar
  • NOW ONLINE
  • Посадник
  • Posts: 34093
  • Thank you received: 74
  • Karma: 22
Vladimirovich wrote:
Ей скормили лучшие образцы для подражания. Так и настраивается нейросетка.
не представляю как это могло произойти, лучших партий море за всю историю :dontknow:

Искусственный Интеллект 14 Дек 2017 03:07 #358

  • Хайдук
  • Хайдук's Avatar
  • NOW ONLINE
  • Посадник
  • Posts: 34093
  • Thank you received: 74
  • Karma: 22
Alexander wrote:
Да я согласен и насчет алгоритма, и в особенности насчет стиля - он у Альфы очень привлекательный, ближе всего Бронштейн с его Давидом против Голиафа. Меня-то другое интересует, насчет истины, насколько такой стиль выдерживает проверку минимаксом с поиском явных опровержений.
Голиаф хто?
у Таля было много некорректных жертв за красиво жить, но почему-то даже Стокфиш не находит опровержений минимаксом... странно это как хорошо Альфа и понимает, и щитает :unsure:

Искусственный Интеллект 14 Дек 2017 04:00 #359

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23301
  • Thank you received: 136
  • Karma: -12
onedrey wrote:
Да ладно, если бы та Альфа играла не на 4-х TPU, а на одном, она сыграла бы уже вничью. 80-100 пунктов как раз соответствует учетверению мощности.
Это от алгоритма сильно зависит. У нас насколько знаю нет информации, как зависит сила игры Альфы от скорости железа. Наиболее интенсивная работа была сделана на стадии обучения.onedrey wrote:
то есть в самостоятельной игре "за доской" де факто переигрывал
Не соглашусь. В тех партиях что я смотрел, Сток вполне оптимистично оценивал свою позицию, а потом в какой то момент его оценка резко менялась, что говорит о том, что он просто не видит какие то вещи. Я вполне допускаю, что на каком то железе Сток сможет сопротивляться Альфе, но это все имхо уже непринципиально. Потенциал алгоритма Альфы значительно превосходит потенциал алгоритма Стока. Если ДипМайнду это будет интересно, они могут значительно усилить свою прогу (например сделают специализацию алгоритма под шахматы), а вот Стоку усиливаться особо нечем. Ну железо посерьезней, но еще на ход глубже посчитает ... Сток это уже можно сказать отыгранный силиконовый гросс. Альфа жертвовала ему пешки за долговременную инициативу, которую если не понимаешь, то хрен просчитаешь.

Искусственный Интеллект 14 Дек 2017 05:58 #360

  • Vladimirovich
  • Vladimirovich's Avatar
  • NOW ONLINE
  • Инквизитор
  • Posts: 75189
  • Thank you received: 937
  • Karma: 77
Хайдук wrote:
Vladimirovich wrote:
Ей скормили лучшие образцы для подражания. Так и настраивается нейросетка.
не представляю как это могло произойти, лучших партий море за всю историю :dontknow:
Обычный pgn-reader. Например :glasses:
Каждому - своё.
Moderators: Grigoriy
Рейтинг@Mail.ru

Научно-шахматный клуб КвантоФорум