Мелкое же жульничество для ПеАра со стороны западного человека или компании это настолько обыденное явление, что к этому уже давно все привыкли. Не значю почему это так вас так корябает.
Да почему Вы решили, что меня что то корябает, я же знаю с кем имею дело.
Какое это имеет принципиальное значение? Вы ещё не забыли что пару страниц назад писали, что даже с помощью Магнуса у Стока нет шансов?
Вы постоянно передергиваете.
Если я говорю "мол откуда у вас сведения, что у Магнуса шансы есть?", это вовсе не значит, что "я_утверждаю_что их нет". Может они и есть и может и превосходные шансы, может Магнус адвансит последние 5 лет по ночам, и только Вам об этом сообщил. Вот это мне и удивительно, что только вы об этом знаете. У меня есть предположение, что ему это нафиг не интересно, раз он никогда не участвовал в таких мероприятиях и ему не интересно бороться с железякой, он не занимался этой темой. Если так, то шансов у него практически нет, поскольку он вряд ли понимает, как играть с прогой против проги.
АльфаЗеро вполне возможно обыграет и СтокФиш с книжкой и на хорошем железе, только мы не знаем как обыграет и с каким счетом, а тот счет который мы видим, то что он ничего не показывает об истинном соотношении сил, это не значит что АльфаЗеро Стокфишу с книжкой проиграет . Очень вероятно только то, что такого же разгрома не будет.
я не шибко представляю как играют в адванс: после выбора хода игроком комп проверяет на форсированные зевки, это понятно, а потом считает дальше и глубже, но ведь игроку невмогота оценивать все конечные позиции, к которым движок приходит; тем более, что оценки движком этих позиций игроку могут не понравиться, зачем терять времени впустую? непонятно как оба налаживают взаимодействие, чтобы друг другу не мешать или раздражать
а тот счет который мы видим, то что он ничего не показывает об истинном соотношении сил
Цель авторов была не соотношение сил с Стокфишем узнать, а продемонстрировать универсальный алгоритм, который с нуля может самообучиться и показать высокий уровень игры. Что авторы блестяще продемонстрировали на примере Го, Сеги и Шахмат. Можно ли усилить Стокфиш таблицами и дебютной книгой? Конечно можно, точно также как можно было проводить матч на другом контроле времени, но все это не принципиально с научной точки зрения. Принципиально, что Альфа смогла играя сама с собой такую дебютную книгу создать!
Принципиально, что Альфа смогла играя сама с собой такую дебютную книгу создать!
В этом как раз ничего восхитительного нет. И вряд ли уместны слова "сама с собой"
Создали правильную архитектуру и скормили мегабазу.
А глупая Вобла без базы...
В этом как раз ничего восхитительного нет. И вряд ли уместны слова "сама с собой"
Может и ничего восхитительного, но это основное достижение статьи. Не вижу повода сомневаться в том что играла сама с собой, иначе статья теряет смысл. Алгоритм наверняка будут проверять конкуренты, ведь при таком методе обучения можно решать задачи где данных для обучения мало или их по каким то причинам не дают использовать.
архитектуру железа Альфы скорее не трогали, её наверняка намыливали на широкий круг задач
после завоевания Го наверно заточили софтверную архитектуру с параметрами под шахматы, что вполне естественно, но вряд ли лгут о том, что никакую мегабазу НЕ скармливали
после завоевания Го наверно заточили софтверную архитектуру с параметрами под шахматы
Нет, все игры изучала одна и таже сеть. Ничего там под шахматы не оптимизировали.
In AlphaZero we reuse the same hyper-parameters for all games without game-specific tuning. The sole exception is the noise that is added to the prior policy to ensure exploration (29); this is
scaled in proportion to the typical number of legal moves for that game type.
Like AlphaGo Zero, the board state is encoded by spatial planes based only on the basic rules for each game. The actions are encoded by either spatial planes or a flat vector, again
based only on the basic rules for each game (see Methods)
Вместо счета АльфаЗеро гоняет симуляции, но симуляции очень умные, что позволяет каким то образом исключить зевок с очень высокой вероятностью. Вот что пишут авторы в секции методы
For at least four decades the strongest computer chess programs have used alpha-beta search (18, 23). AlphaZero uses a markedly different approach that averages over the position evaluations within a subtree, rather than computing the minimax evaluation of that subtree. However, chess programs using traditional MCTS were much weaker than alpha-beta search programs, (4, 24); while alpha-beta programs based on neural networks have previously been unable to compete with faster, handcrafted evaluation functions. AlphaZero evaluates positions using non-linear function approximation based on a deep neural network, rather than the linear function approximation used in typical chess programs. This provides a much more powerful representation, but may also introduce spurious approximation
errors. MCTS averages over these approximation errors, which therefore tend to cancel out when evaluating a large subtree. In contrast, alpha-beta search computes an explicit minimax, which propagates the biggest approximation errors to the root of the subtree. Using MCTS may allow AlphaZero to effectively combine its neural network representations with a powerful, domain-independent search
Я читал, но не очень понял фразу "different approach that averages over the position evaluations within a subtree". И сейчас толком не понимаю, почему это должно устранять тактические ошибки
Почитал всю статью...
Ощущение крупного хайпа arxiv.org/pdf/1712.01815.pdf
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
АльфаЗеро вполне возможно обыграет и СтокФиш с книжкой и на хорошем железе, только мы не знаем как обыграет и с каким счетом, а тот счет который мы видим, то что он ничего не показывает об истинном соотношении сил, это не значит что АльфаЗеро Стокфишу с книжкой проиграет . Очень вероятно только то, что такого же разгрома не будет.
По-моему, все упиралось в то, что видимо не так просто распараллелить Стокфиш на большой машине, и поэтому гугловцы нашли более-менее стоящее железо, на котором все запускалось без проблем. Причем совсем не факт, что при быстродействии в петафлопы Сток вообще проиграет.
Но вы наверняка обратили внимание на стиль побед. Это не обычная движковая игра с борьбой насмерть за сотую пешки перевеса, а что-то более сильное и эстетически значительно более привлекательное. Но возможно опровергаемое петафлопами
Почитал всю статью...
Ощущение крупного хайпа arxiv.org/pdf/1712.01815.pdf
Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm
но ведь ущучила же Альфа лучшего Го игрока Ли Седоля, а Го покруче шахмат будет
Го покруче, поэтому тот успех я считаю более серьезным
А этот лишь доказывает, что ув.РР настолько заблуждался в "понимании" Гудиней, вобл и прочих железяков
Есть в аду особый отдел для специалистов по вероятности.
Там много пишущих машинок и обезьян. Пробегая по клавишам пишущей машинки, обезьяна всякий раз случайно печатает какой-нибудь сонет Шекспира.
Го покруче, поэтому тот успех я считаю более серьезным
А этот лишь доказывает, что ув.РР настолько заблуждался в "понимании" Гудиней, вобл и прочих железяков
Хотелось бы посмотреть на это с Альфой.
Но даже если ничего такого не случится, все равно будут постепенно появляться углубленные анализы приведенных партий. Думаю, впереди немало сюрпризов
этот лишь доказывает, что ув.РР настолько заблуждался в "понимании" Гудиней, вобл и прочих железяков
А разве я писал, что у них какое то сверх понимание есть? Я сравнивал их понимание с человеческим, основанном на примитивных аппроксимациях, подсчете материала, итд В каких то позициях человек демонстрирует лучшее понимание, а в каких то воблы. Альфа похоже вышла на качественно более высокий уровень, раз подняла серьезные дебютные идеи с жертвой материала всего за несколько часов самообучения. Это и интересно!
Я сравнивал их понимание с человеческим, основанном на примитивных аппроксимациях, подсчете материала, итд В каких то позициях человек демонстрирует лучшее понимание, а в каких то воблы. Альфа похоже вышла на качественно более высокий уровень, раз подняла серьезные дебютные идеи с жертвой материала всего за несколько часов самообучения.
человеческое понимание далеко не примитивно, некоторые типы/рисунки позиций должно лучше Альфы чуёт и просекает; наверно и обратное верно: будут позиции, куда Альфа недаром прёт, но колокола для башки те не колышут вообще и потенциала в них башка хоть убей не видит
важно другое, однако: правильно определить феномен понимания, которое всегда нелокально в отличие от отдельных ходов, воспаривает (или не) как эмерджентный эффект от расположения и взаимодействия фигур для заданной конкретной позиции; разумеется, очень глубокий и широкий (петафлопный по Александру) счёт простых вобл в конце концов сумел бы в принципе набрезти на те же результаты (и даже лучшие, поскольку застукают случайную тактику) поскольку игра элементарно конечно-комбинаторная
человеческое понимание далеко не примитивно, некоторые типы/рисунки позиций должно лучше Альфы чуёт и просекает
Топ гроссы надеюсь переосмыслят качество понимания Воблы, которой они привыкли доверять в оценке позиций. Альфа показала, что играя в стиле Великого Таля, можно одерживать победы над счетчиком, ставящим материальное превосходство во главу угла. Очевидно Альфа осознала какие то новые и важные критерии оценки позиций.
AlphaZero plays a very different game of chess. It is willing to sacrifice pieces in order to gain a positional advantage over its opponent. It is playing a kind of chess judo where it uses an opponents eagerness in achieving an immediate gain against itself. It sets up its opponent into what is known in chess as “zugzwang”, where every move that one makes leads to a worse outcome. It seems to have a more holistic sense of the game of chess where all its pieces move in a highly coordinated manner. AlphaGo zero plays a game that maximizes its creativeness against a logical opponent that is unable to see beyond short term gains. It plays a game of chess that is not only unimaginable, but would in the past been placed in a pedestal for all to marvel.
не думаю, что гроссы высокого мнения об оценках позиций воблой, не за это её любят и ... боятся, а за непобедимый (ими) счёт, чем она их берёт на досуге.