Ключевое слово
23 | 09 | 2019
Новости Библиотеки
Шахматы Онлайн
Welcome, Guest
Username: Password: Remember me

TOPIC: Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 10 Сен 2019 17:52 #961

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23662
  • Thank you received: 143
  • Karma: 4
Ruslan73 wrote:
У Гаррека огромный отрыв. Я почему-то думал, что Магнус намного ближе.
Спасибо. Я почему то думал, что Крамник совсем на короткий срок ГК обошел, неужели он действительно 9 месяцев был первым номером?

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 10 Сен 2019 17:55 #962

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
А у женщин непонятно, догонит ли кто-то когда-то Юдит?


IMG_20190910_205135.jpg


Пиа Крамлинг в женских шахматах, по этому показателю, получается, сравнима с Борисычем в мужских. :)
Last Edit: 10 Сен 2019 18:53 by Ruslan73.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 10 Сен 2019 17:59 #963

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
PP wrote:
Ruslan73 wrote:
У Гаррека огромный отрыв. Я почему-то думал, что Магнус намного ближе.
Спасибо. Я почему то думал, что Крамник совсем на короткий срок ГК обошел, неужели он действительно 9 месяцев был первым номером?

Все так, 1 раз только обогнал, но тогда рейтинги 2 раза в год публиковались, вот и получилось 6 месяцев. Еще раз он был в 2008 когда Гаррик ушел, и тогда рейтинги уже раз в квартал обновлялись. 6+3.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 10 Сен 2019 18:23 #964

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
PP wrote:
О было 5, теперь уже 7 прогресс.
Это была рюсска пословица... Вы уже все забыли, втч рюсски язык...
PP wrote:
Я вижу Вы в методе ничего так и не поняли. Нейросетка дает мгновенную оценку позиции без всякого счета. Она считает ровно на ноль ходов.
А еще она может выиграть без фигуры и вырастить зуб аля-гаряев
Не смешно

Вы и статью не читали :figa: и фигурки не двигали....
Разумеется алгоритм считает и еще как хорошо

habr.com/ru/post/432370/
Иллюстрация алгоритма поиска ходов AlphaZero. Изображение DeepMind из статьи в Science.
Согласно DeepMind, AlphaZero использует поиск по дереву Монте-Карло и изучает около 60 000 позиций в секунду, по сравнению с 60 миллионами для Stockfish.

Вот и все "понимание". Железо позволяет
Дать бы Вобле заранее посмотреть позиции вперед по монте-карле...
И еще неизвестно какие высоты нас ждут.
Я то вижу оценки воблины...

201909_alpha.jpg

По данным DeepMind, для генерации первого набора игр для самостоятельной игры использовалось 5000 TPU (тензорный процессор Google, специализированная интегральная схема для ИИ), а затем 16 TPU использовались для обучения нейронных сетей.

5000 TPU, джентльмены...
И еще кто-то удивляется знанию теории дебютов...
Новая версия AlphaZero обучила себя играть в шахматы, начиная с правил игры, используя методы машинного обучения, чтобы постоянно обновлять свои нейронные сети.



P.S. А главное, мне возражают люди, которые оценки движков черпают из констант в хедерах.
Так вот, джентльмены :thumbup:
Каждому - своё.
Last Edit: 10 Сен 2019 18:26 by Vladimirovich.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 10 Сен 2019 18:57 #965

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23662
  • Thank you received: 143
  • Karma: 4
Vladimirovich wrote:
Вы и статью не читали и фигурки не двигали....
Вот Хайдук, уровень обсуждения на нынешнем КФ. Любуйтесь.Vladimirovich wrote:
Дать бы Вобле заранее посмотреть позиции вперед по монте-карле...
Вобла их и смотрит, но по альфа бете. Надеюсь, теперь когда Вы удосужились глянуть в статью, Вы поняли наконец, что поиск ведется не нейросетью, а нейросеть используется только для оценки возникающих позиций.Vladimirovich wrote:
5000 TPU, джентльмены...
Вижу, что пока Вы еще не очень внимательно изучили статью. 5000 TPU использовалось для генерации партий против себя самой. Гораздо меньшее число использовалось, для самообучения по результатам этих партий, ну и наконец для игры против воблы использовалось уже очень малое количество TPUs ибо на тот момент нейросеть уже стала обладать шахматным пониманием, позволяющим обыгрывать воблу анализируя в тысячи раз меньше позиций. Еще и фору по времени давала десятикратную.Vladimirovich wrote:
P.S. А главное, мне возражают люди, которые оценки движков черпают из констант в хедерах.
Слив засчитан. Bye.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 10 Сен 2019 19:09 #966

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
Однако по соотношению сила игры/цена железа Вобла пока намного лучше.

За какие-нить 1300$ вполне можно системник собрать с 12 ядрами и 24 потоками + 48 гигов памяти. И на нём Вобла будет играть вполне достойно.

А для Альфы гуглоидам небось даже 1 TPU для игры за такие копейки не купить. :dontknow:
Last Edit: 10 Сен 2019 19:17 by Ruslan73.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 11 Сен 2019 00:54 #967

  • гуглоид
  • гуглоид's Avatar
А для Альфы гуглоидам небось даже 1 TPU для игры за такие копейки не купить.
cloud.google.com/tpu/pricing :beer:

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 11 Сен 2019 03:23 #968

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
Ага, нам предлагается на каждую партию время работы TPU выкупать.

Бандиты с большой дороги. :mad:
Last Edit: 11 Сен 2019 04:53 by Ruslan73.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 11 Сен 2019 04:43 #969

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
PP wrote:
Вот Хайдук, уровень обсуждения на нынешнем КФ. Любуйтесь.
Да, ув.Хайдук... Нервы у нашего дорогого РР ни к черту :)
PP wrote:
Надеюсь, теперь когда Вы удосужились глянуть в статью, Вы поняли наконец, что поиск ведется не нейросетью, а нейросеть используется только для оценки возникающих позиций.
PP wrote:
Нейросетка дает мгновенную оценку позиции без всякого счета. Она считает ровно на ноль ходов.

О Майн Готт... Ну хорошо, я был неточен в терминах, а Вы опять нервничаете, вместо того, чтобы пытаться понять друг друга.
Это неизбежно, что это будет происходить, пока Вы не удосужитесь задавать вопросы там, где Вам что-то непонятно, а не изображать Дельфийский Оракул :)

"Нейросеткой" я для простоты называю весь алгоритм Альфы, чтобы отличить его от предыдущего "хардкорного" поколения.
Сама по себе отдельно взятая нейросеть это одна большая функция над векторами, скажем так, да.
Но это ключевой элемент алгоритма Альфы для построения графа ходов, отличающий ее от Воблы и Гудини.

И поймите правильно, она не может "считать" на ноль ходов.
Ибо сама оценка позиции уже должна включать ближайшую сетку вариантов, например получение мата на следующем ходу :)
Также оценка массы позиций зависит от того, есть ли через пять ходов комбинационный удар или нет.
И тот факт, что Альфа не промахивается, означает, что ее оценки учитывают это будущее.

Поэтому эта оценка Альфы не может быть статической, функцией только лишь позиции, не учитывающей ближайшее будущее
Или и тут есть возражения?
(Возможно это рекурсивная нейросетка, но я не буду гадать, этого я не знаю, не суть)
PP wrote:
Вижу, что пока Вы еще не очень внимательно изучили статью. 5000 TPU использовалось для генерации партий против себя самой.
Очень хорошо. Пусть так. Но никаких следов понимания отсюда не видно
:beer:
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 11 Сен 2019 05:20 #970

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
И для общего мировоззрения, попытаемся все-таки еще раз объяснить, что же такое понимание в человеческом смысле.

Обычный расчет ведется последовательно - ходы кандидаты и строятся ветки от них.

"Понимание" же это алгоритм построения графа ходов наоборот, издалека.
Сначала ставятся далекие маяки, потом ставятся другие, уже не через километр, а уж потом ищутся тактические реализации путей между ними
Притом не факт, что все эти маяки могут быть связаны. Но что останется, то и искомый путь.

Опять же, может быть и так, что не может быть построено ни одного пути, ибо тактически нереализуемо.
Тогда приходится искать ходы обычным способом и может быть найти изначально невидимые ходы - результирующие, которые по определению не относятся к пониманию.
Кстати, очень многие "нечеловеческие" ходы железяк относятся именно к последним в человеческом смысле.

В сугубом смысле "понимание" это не вся эта схема выше, а искусство нахождения маяков - интуицией, знаниями или кознями демонов
Это все индивидуально для шахматиста. Например Моисеич: Если Таль пожертвует сюда фигуру, то нужно разменять ладьи, а ферзей сохранить
Или Смыслов: Ладейку по пятой... И т.д.

Также понимание не разделяется на комбинационный и позиционный стиль.
Можно заранее видеть комбинационный удар например. Или позиционную жертву, уходящую за горизонт расчета...

Понятно, что на практике обе схемы расчета сосуществуют для человека неразрывно, хотя у всех по разному.
И если у шахматиста А понимание развито более сильно, то это не ставит его выше шахматиста Б. Это просто особенности мышления.
(У нас правда карлсенофилы очень любят подчеркивать термин "понимания" в качестве средства выделения из толпы :) )

Практически непрофессионалу очень сложно понять, каким путем шахматист пришел к тому или иному решению

Косвенно это можно понять по уровню игры в блиц - человек просто играет маяками и прет напролом, рискуя конечно огрести от счетчика на этом пути.
Зато быстро и планово. И если не огребет, то имеет лучшие результаты.
Также этот стиль обеспечивает более стабильный уровень игры в старости, хотя никак не говорит об общем классе игры сам по себе.

Или по комментариям к партиям - Моисеич вот много писал и я вижу, что он обладал очень тонким пониманием, хотя ММ в блиц не играл принципиально.
Таль обладал особым пониманием, играл очень далекими маяками и огребал зато массово от счетчиков Корчного и Полугаевского...
(В возрасте Корчной сумел развить в себе упорной аналитической работой еще и отличное понимание, но было поздно, пришел молодой Карпов)

Вот теперь, когда я постарался по возможности подробно разъяснить, что такое понимание (в меру сил, старшие мастера бы поправили)...
Скажите ув.РР, что в этой картине мира Вас не устраивает и какие факты, Вам известные, возможно ей противоречат?


P.S. quantoforum.ru/champions/228-ponimanie-s...mat?start=450#378895
Каждому - своё.
Last Edit: 11 Сен 2019 05:48 by Vladimirovich.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 02:22 #971

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 37882
  • Thank you received: 85
  • Karma: 22
здаётся мне, что вышесказанное никак не бьётся с выкрутасами Альфы :P

Alexander wrote:
Надо не просто ставить маяки - надо научиться ставить правильные маяки. И в процессе выбора пути еще и использовать правильные фонарики
AlphaZero использует поиск по дереву Монте-Карло и изучает около 60 000 позиций в секунду, по сравнению с 60 миллионами для Stockfish.
на 3 порядка меньше и в целом правильных позиций изучает Альфа как раз за счёт накопленного 5000 TPU «понимания», а просчитывание ближайшей сетки вариантов не проблема для любого компа.

Vladimirovich wrote:
для общего мировоззрения, попытаемся все-таки еще раз объяснить, что же такое понимание в человеческом смысле
как уже было отмечено, Альфа как-будто зделала не мало для поисков объективных, универсальных, не антропоморфных признаков понимания :beer:
Last Edit: 12 Сен 2019 02:25 by Хайдук.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 05:05 #972

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
Хайдук wrote:
для поисков объективных, универсальных, не антропоморфных признаков понимания
Шахматы это игра человека с человеком. Неантропоморфные признаки не имеют никакой ценности. :flag:
Last Edit: 12 Сен 2019 05:06 by Ruslan73.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 06:13 #973

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
Хайдук wrote:
как уже было отмечено, Альфа как-будто зделала не мало для поисков объективных, универсальных, не антропоморфных признаков понимания :beer:

Мы, ув.Хайдук, еще не очень представляем, что такое антропоморфное понимание, а Вы уже изволите судить о неантропоморфном
:beer:
Хайдук wrote:
на 3 порядка меньше и в целом правильных позиций изучает Альфа как раз за счёт накопленного 5000 TPU «понимания», а просчитывание ближайшей сетки вариантов не проблема для любого компа.
Если некто сильно оптимизировал алгоритм поиска глобального экстремума за счет 5000 TPU для какого то класса функций, то значит ли это, что железяка приобрела "понимание"?
That is the question
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 06:46 #974

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
Это понимание, как считать чуть меньше но играть также сильно. Однако в сравнении с человеком Альфа все равно считает невероятно много.

Ну вот вышла машина с инжекторным двигателем вместо карбюраторного. Расход топлива меньше, загрязнение воздуха тоже. Все счастливы.

Машина и на том и на том двигателе человека обгоняет. Однако какое отношение все это имеет к легкой атлетике?
Last Edit: 12 Сен 2019 06:57 by Ruslan73.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 07:00 #975

  • Ruslan73
  • Ruslan73's Avatar
  • OFFLINE
  • Администратор
  • Posts: 21885
  • Thank you received: 317
  • Karma: 10
Подобное демонстрировала кстати когда-то и Рыбка. Она считала меньше всяческих Фрицей но играла хорошо. Однако сам её создатель сказал, что Рыбка - это игрок уровня 2100 у которого есть 5 лет на обдумывание хода.
Last Edit: 12 Сен 2019 07:01 by Ruslan73.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 07:21 #976

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23662
  • Thank you received: 143
  • Karma: 4
Vladimirovich wrote:
"Нейросеткой" я для простоты называю весь алгоритм Альфы
Ну вы конечно можете выдумывать какие угодно названия, но простоту это не в вносит, а одну лишь путаницу.

Vladimirovich wrote:
Ибо сама оценка позиции уже должна включать ближайшую сетку вариантов, например получение мата на следующем ходу
Ну вот видите, опять ошибаетесь. Оценка позиции производится как раз таки нейросетью и без всякого расчета будущих вариантов. Как я уже писал выше, сеть не считает вперед совсем, просто дает оценку на основе уже имеющейся информации о позиции и оценка эта как раз и отражает понимание альфы. Не было бы понимания, не был бы эффективным дальнейший поиск монте карлом, ибо пришлось бы считать чертову уйму позиций.

Vladimirovich wrote:
Поэтому эта оценка Альфы не может быть статической, функцией только лишь позиции, не учитывающей ближайшее будущее
Вместо того чтобы оценивать, альфа тупо разыгрывает сама с собой партии для разных ходов кандидатов и эмпирически вычисляет ход с наибольшей вероятностью победы. Примерно как человек, который проверяет ходы кандидаты. Партии очевидно играются не случайные, а такие, ходы которых согласуются с рекомендациями сети. Иными словами если бы сеть не видела мгновенно пользу от жертвы фигуры без всяких дальнейших просчетов, то этот ход и не попал бы в список кандидатов в принципе.

Vladimirovich wrote:
В сугубом смысле "понимание" это не вся эта схема выше, а искусство нахождения маяков - интуицией, знаниями или кознями демонов
Вот как раз это сеть и делает. Находит маяки, а дальше эмпирически определяет путь к достижению стратегической цели. Например во многих партиях альфа понимает, что надо задвинуть пешку на какой нибудь h6 чтобы ограничить короля противника на h8. Это маяк, а потом она находит конкретный способ осуществить цель с учетом тактических нюансов.
Last Edit: 12 Сен 2019 11:14 by Хайдук.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 07:46 #977

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
PP wrote:
Ну вот видите, опять ошибаетесь. Оценка позиции производится как раз таки нейросетью и без всякого расчета будущих вариантов. Как я уже писал выше, сеть не считает вперед совсем, просто дает оценку на основе уже имеющейся информации о позиции и оценка эта как раз и отражает понимание альфы.

Т.е Вы хотите сказать, что в позиции Х Альфа дает оценку +5, а потом, уже расчетом, обнаруживает, что там ей мат в два хода?
Это Вы называете пониманием?
Или оценка позиции уже "знает", что мат через два хода? И так для всех возможных позиций... (Коих, заметим в скобках 1043)

PP wrote:
Вместо того чтобы оценивать, альфа тупо разыгрывает сама с собой партии для разных ходов кандидатов и эмпирически вычисляет ход с наибольшей вероятностью победы.
Слово "тупо" опять вероятно говорит нам о ее понимании :)

PP wrote:
Вот как раз это сеть и делает. Находит маяки, а дальше эмпирически определяет путь к достижению стратегической цели. Например во многих партиях альфа понимает, что надо задвинуть пешку на какой нибудь h6 чтобы ограничить короля противника на h8. Это маяк, а потом она находит конкретный способ осуществить цель с учетом тактических нюансов.
А вот это утверждение требует конкретных доказательств
Не будете ли так любезны привести какие то свидетельства, что Альфа именно так подходит к расчету?

P.S.
(Я честно таких статей не читал.
Да и пешка на h6 или конь на е5 это уровень понимания третьего разряда
А вот если она строит действительно сложные маяки, то это изменит мое отношение)

P.P.S
И еще, если нейросетка делает только оценку, и "считает" на 0 ходов, то кто строит маяки на много ходов вперед? Алгоритм расчета?
Тогда именно он обладает "пониманием". Почему мы не слышим дифирамбы именно ему?
И что будет, если его прикрутить к Вобле и оставить ее ОФ? А 5000 TPU засунуть куда нибудь (Лимародесса, молчать!)
Может тогда Вобла оставит от Альфы рожки и ножки? :glasses:
Каждому - своё.
Last Edit: 12 Сен 2019 11:15 by Хайдук.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 12:01 #978

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 37882
  • Thank you received: 85
  • Karma: 22
Vladimirovich wrote:
хотите сказать, что в позиции Х Альфа дает оценку +5, а потом, уже расчетом, обнаруживает, что там ей мат в два хода?
разумеется - случайные ближайшие пробоины вполне могут угробить любой прекрасный план-понимание :dumb:

Vladimirovich wrote:
Слово "тупо" опять вероятно говорит нам о ее понимании
прочёсывание ближайшей тактики всегда тупое :(

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 12:46 #979

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
Хайдук wrote:
разумеется - случайные ближайшие пробоины вполне могут угробить любой прекрасный план-понимание :dumb:
Ну тогда это явно неантропоморфное понимание :)
Человек автоматически видит мат (если он не Крамник :hihihi: не поплыл внезапно, человек слаб) и это часть его понимания позиции. :xren:
Понимание неотделимо от расчета.
Это только в фантазиях чьих-то есть понимание со счетом 0 и расчет и этим занимаются разные компоненты.
Но если это вдруг и так для железяки, это автоматически переводит ее в разряд конечных автоматов без мозга вовсе

Я же объяснял выше - если убрать расчет совсем, скажем игра в пулю, все равно останутся маяки и игра рукой по ним.
Это лишь другая форма расчета - фактически промежуточные ребра и вершины графа игнорируются, но сам граф построен в том или ином виде в мозгу.
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 14:48 #980

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23662
  • Thank you received: 143
  • Karma: 4
Vladimirovich wrote:
Вы хотите сказать, что в позиции Х Альфа дает оценку +5, а потом, уже расчетом, обнаруживает, что там ей мат в два хода?
Не совсем. Грубо говоря, Монте-Карло поиск рассматривает ход поскольку сеть приписывает позиции высокую вероятность победы, там шкала от 0 до 1 или от -1 до 1 кажется. Дальше играются партии ходы которых опять генерятся с помощью сети. По проценту выигрышных партий выбирается лучший ход. Сеть без всякого расчета дает позиции вероятность победы на основе понимания выработанного во время самообучения, где результаты этих партий с собой бэкпропагировались через сеть для настройки слоев.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 14:57 #981

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23662
  • Thank you received: 143
  • Karma: 4
Vladimirovich wrote:
Человек автоматически видит мат
А сеть автоматически говорит, что позиция выиграна, но не говорит как выиграна. Как двигаться к победе показывает Монте-Карло. Человек тоже сначала по маякам чует что должен быть выигрыш, а потом его находит. Если мат в два хода все происходит так быстро, что кажется будто понимание не отделено от счета.
Last Edit: 12 Сен 2019 14:58 by PP.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 17:07 #982

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
PP wrote:
Сеть без всякого расчета дает позиции вероятность победы на основе понимания выработанного во время самообучения, где результаты этих партий с собой бэкпропагировались через сеть для настройки слоев.

Тем не менее, все это не показывает, что это какое-то понимание. Набита статистика на основе неких масок позиций...
Преодолел лень :) и посмотрел статью. Там ничего не сказано о том, что видятся какие то "понимательные" для человека вещи
Это лишь некое абстрагированное знание, которое очень полезно, если особенно помножить на 5000 TPU

Статистика по мегабазам данных человеческим тоже профи изучается.
И если в некоем варианте 30% белыми только скажем, то это вариант плохой. Но понимания почему плохой, это не прибавляет :figa:
Надо считать самому и разбираться. А до этого туда просто не ходить (а то снег башка попадет).
Это очень рациональный и грамотный подход, но к пониманию (в человеческом смысле) отношения имеет мало

Вот ключевой момент, о котором я и ранее говорил (из альфовой же статьи)
The efficiency of alpha-beta search depends critically upon the order in which moves are considered.
MCTS averages over these approximation errors, which therefore tend to cancel
out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax, which propagates the biggest approximation errors to the root of the subtree.

Т.е. главная заслуга разработчиков Альфы в соединении Монтекарлы с нейросеткой, что сглаживает косяки хардкорных движков с альфа-бетой. На этом Воблу и взяли голыми руками.
Тогда и понятно, почему явное впечатление, что Альфа просто идет на два хода впереди по оценке. Вобла то потом все сама видит, но поздно.
Отсюда и результат
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 21:05 #983

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 37882
  • Thank you received: 85
  • Karma: 22
PP wrote:
сеть автоматически говорит, что позиция выиграна, но не говорит как выиграна. Как двигаться к победе показывает Монте-Карло. Человек тоже сначала по маякам чует что должен быть выигрыш, а потом его находит. Если мат в два хода все происходит так быстро, что кажется будто понимание не отделено от счета.
не думаю, что сеть может на 100% предвосхитить выигрыш, прочёсывание путей к этому «выигрышу» может обнаружить фатальные (хоть и случайные, относительно маловероятные) пробоины сводящие на нет (вероятностную всё-таки!) рекомендацию сети :idea:

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 12 Сен 2019 21:05 #984

  • PP
  • PP's Avatar
  • OFFLINE
  • Боярин
  • Posts: 23662
  • Thank you received: 143
  • Karma: 4
Vladimirovich wrote:
Тем не менее, все это не показывает, что это какое-то понимание. Набита статистика на основе неких масок позиций...
Так же как и у человека маяки возникают на основе опыта, можно это назвать и статистикой. Нейросеть научилась вычленять из позиции кучу позиционных нюансов, без всякого счета. Поэтому может запросто жертвовать материал за инициативу и проводить планы. Конечно считает пока больше позиций чем человек, но и играет на порядок сильнее. И играет последовательно, а не как вобла, которая всюду ищет случайную тактику.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 13 Сен 2019 05:08 #985

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
PP wrote:
Так же как и у человека маяки возникают на основе опыта, можно это назвать и статистикой.
Ну обучение всегда какой-то опыт :)
Еще раз подчеркну - человеческое понимание это принципиально другая схема мышления - обратная
По сути это аналог синтеза VS анализа - ставится цель и ищется траектория VS строим путь и смотрим что получилось.
PP wrote:
Нейросеть научилась вычленять из позиции кучу позиционных нюансов, без всякого счета. Поэтому может запросто жертвовать материал за инициативу и проводить планы.
Я же не спорю с тем, что она играет сильнее и интереснее Воблы. Но вот за счет чего...
Чтобы делать выводы, надо смотреть конкретные оценки по ходам
К сожалению, я могу только воблины оценки проверить. Альфиных нет...
А то бы мы посмотрели, какая она сухов гюльчетай :xren:
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 13 Сен 2019 05:43 #986

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 37882
  • Thank you received: 85
  • Karma: 22
Vladimirovich wrote:
человеческое понимание это принципиально другая схема мышления - обратная... ставится цель и ищется траектория... строим путь и смотрим что получилось.
не думаю, что принципиально обратная: цель застукиваем на базе видимого башке рисунка позиции, нет смысла ставить априорные цели с бодуна потолка без корней в позиции.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 13 Сен 2019 05:51 #987

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
Хайдук wrote:
Vladimirovich wrote:
человеческое понимание это принципиально другая схема мышления - обратная... ставится цель и ищется траектория... строим путь и смотрим что получилось.
не думаю, что принципиально обратная: цель застукиваем на базе видимого башке рисунка позиции, нет смысла ставить априорные цели с бодуна потолка без корней в позиции.

А при чем тут поиски смысла? :) Речь о схеме построения графа.
А какой в этом смысл, дело уже десятое. Может вообще в шахматах никакого смысла нет :lol:

Вот зачем мне надо было стремиться к такой позиции? :) Никакого бодуна :figa:

quantoforum.ru/lab/532-bestiarij?start=750#457038







6k1/8/6p1/5p1p/1K3P1b/8/1r6/r1r5 w - - 0 65
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 13 Сен 2019 06:24 #988

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 37882
  • Thank you received: 85
  • Karma: 22
смысл в том, что построение графа ходов для вычурных, волюнтаристских целей с большой долей вероятности будет невыполнимо :dumb:

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 13 Сен 2019 06:39 #989

  • Vladimirovich
  • Vladimirovich's Avatar
  • OFFLINE
  • Инквизитор
  • Posts: 80662
  • Thank you received: 1118
  • Karma: 81
А если не вычурных? Например, соперник плохо катает эндшпиль...
Маяк - Меняем ферзей - и рисунок позиции тут глубоко вторичен, лишь бы эндшпиль был игровой
Каждому - своё.

Шахматный террариум: чемпионы, сильнейшие, рейтинг, очки #1 13 Сен 2019 07:27 #990

  • Хайдук
  • Хайдук's Avatar
  • OFFLINE
  • Наместник
  • Posts: 37882
  • Thank you received: 85
  • Karma: 22
полагаю, что Альфа вполне может заценить рисунок с ферзями и игровой таковой без оных :yess:
Moderators: Vladimirovich, Ruslan73
Рейтинг@Mail.ru

Научно-шахматный клуб КвантоФорум