Компьютер впервые обыграл человека в игру Го
Программисты Google создали новую программу, которая смогла обыграть чемпиона Европы по игре в Го. Теперь с искусственным интеллектом намерен посоревноваться чемпион мира по Го из Южной Кореи Седол Ли. /epochtimes.ru/
Программа под названием AlphaGo впервые смогла обыграть чемпиона Европы по игре в Го со счётом 5:0. Кроме того, программа обошла в этой игре и все остальные компьютерные стратегии.
Игра Го — логическая настольная игра, пришедшая из древнего Китая. В неё играют два игрока, один выбирает чёрные фишки, другой — белые. Цель игры — отгородить на игровой доске камнями своего цвета бо́льшую территорию, чем у противника.
Из-за большого размера доски и трудностей в прогнозировании ходов игра Го считается сложной для искусственного интеллекта. Самые лучшие программы пока доходили только до уровня игроков-любителей. В отличие от шахмат в Го существует гораздо больше ходов и комбинаций. Это усложняет создание алгоритмов для их просчёта.
ИИ AlphaGo от Deep Mind обыграл чемпиона мира по логической игре го
В сфере развития искусственного интеллекта произошло весьма значимое событие. Программа AlphaGo, разработанная подразделением Google, компанией DeepMind, одержала победу над мировым чемпионом в логическую настольную игру го, корейцем Ли Си Долом, в рамках первой из пяти исторических партий, которые пройдут в Сеуле. Первую партию Ли проиграл спустя три с половиной часа игры, в то время как на часах оставалось еще 28 минут и 28 секунд до конца.
Это первое в истории этой игры соревнование между профессиональным игроком в го 9-го, наивысшего дана и компьютером. Главным призом соревнования является 1 миллион долларов. Кто в конечном итоге заберет окончательную победу, мы сможем узнать через несколько дней.
«Я был крайне удивлен. Я не ожидал проигрыша. Я не думал, что AlphaGo будет играть в такой совершенной манере», — заявил чемпион мира в игру го.
Основатель компании DeepMind Дэмис Хассабис выразил свое «глубокое уважение Ли Си Долу и его невероятным навыкам», назвав также игру го «невероятно увлекательной» и «очень напряженной». Капитан команды AlphaGo Дэвид Сильвер отметил «удивительную сложность интересной игры го, которая заставила их детище AlphaGo работать практически на максимуме своих возможностей».
Для тех, кто не знает, го — это логическая настольная игра с очень глубоким стратегическим содержанием, возникшая еще в Древнем Китае по разным оценкам 2,5-5 тысяч лет назад. Она рассматривается как одно из самых серьезных испытаний для ИИ, так как в ней содержится огромное количество возможных комбинаций ходов. Несмотря на то, что компьютерные программы уже довольно неплохо освоили такие игры, как шахматы и шашки, и даже одерживали победы над чемпионами мира в этих дисциплинах, высокий уровень интуиции и стратегического мышления, которое требуется от игрока в го, делает ее гораздо сложнее вышеуказанных игр и очень трудной в освоении для компьютера.
Программа AlphaGo компании DeepMind является в настоящий момент наиболее продвинутой среди всех остальных и построена с использованием очень сложной и многоуровневой системы нейронных сетей, а также обладает способностью машинного обучения. Благодаря этому AlphaGo смогла победить европейского чемпиона в игру го Фань Хуэя в прошлом году. Поэтому своеобразным новым уровнем для нее является корейский игрок и мировой чемпион игры го Ли Си Дол.
«Я не жалею, что принял этот вызов», — говорит Ли.
«Но я в шоке, я действительно это признаю. Но что сделано, то сделано. Мне очень понравилось играть с компьютером, и я очень жду следующей игры. Мне кажется я проиграл потому, что в буквальном смысле сдал начало партии. Поэтому в следующий раз я обращу больше внимания на начало игры. Думаю, это увеличит мои шансы на победу».
Ли отмечает, что был глубоко удивлен тому, насколько мощно AlphaGo начала раунд и какие неожиданные для него шаги она совершала.
Следующая партия Ли и AlphaGo состоится завтра. Оставшиеся три пройдут в субботу, воскресенье и вторник. Как бы ни закончилась данная серия игр, сегодняшняя победа AlphaGo является огромным шагом в развитии ИИ. Однако Ли не терпится взять реванш.
«Сегодняшняя игра была очень плотная и напряженная», — говорит Хассабис.
«Когда подошло время начала первой партии, мы правда не знали, чем это все обернется. Да и сейчас не знаем. Ведь впереди еще четыре игры».
Компьютер обыграл человека в игру го
Новости 2.0 — новостной сайт нового формата. Вы сами выбираете интересные и актуальные темы. Самые лучшие попадают на главную страницу.
Искусственный интеллект впервые обыграл человека в игру Го
Специалисты из компании Google создали первую в мире систему искусственного интеллекта под названием AlphaGo, которая впервые смогла обыграть чемпиона Европы по игре в Го со счетом 5:0 и обыграть все остальные компьютерные системы игры в эту древнюю китайскую стратегию, говорится в статье, опубликованной в журнале Nature.
«Впервые компьютер смог составить конкуренцию профессионалу-человеку в полностью честной игре, и я был почтен, что я стану следующим противником AlphaGo. Вне зависимости от того, проиграю ли я или выиграю, этот результат стал важной вехой в истории Го. Я слышал, что эта система ИИ очень сильна в игре и становится только умнее, но я уверен, что я смогу выиграть у нее хотя бы в первый раз», — заявил Седол Ли (Sedol Lee), чемпион мира по Го из Южной Кореи.
Данная система искусственного интеллекта была разработана Дэвидом Сильвером и его коллегами из подразделения DeepMind компании Google, базирующейся в Лондоне (Великобритания).
Как отмечают ученые, до создания их программы все системы ИИ, способные играть в Го, находились на достаточно низком уровне – пределом их возможностей была способность обыграть сильного любителя, но не профессионала. Это объясняется тем, что в отличие от шахмат, в Го возможно гораздо больше ходов и комбинаций, что на порядки усложняет создание алгоритмов, способных «просеивать» их, сокращать время расчетов следующего хода и предсказывать действия соперника.
Сильвер и его коллеги смогли преодолеть эту проблему, построив свой ИИ на базе не одной, а сразу двух нейронных сетей – особых алгоритмов, имитирующих работу цепочек нейронов в мозге человека. Одна из них отвечает за оценку текущей позиции на доске, а вторая использует результаты анализа, подготовленные первой сетью, для того, чтобы выбирать следующий шаг.
«Сеть оценок», как объясняют ученые, нужна в первую очередь для того, чтобы резко сократить число возможных ходов на доске и тем самым упростить вычисления, «сеть решений» – для выбора оптимального шага из самых густых ветвей «дерева» возможных решений.
Обе эти сети прошли длительную и интенсивную «тренировку», обучаясь элементарным правилам игры в Го и тонкостям мастерства в этой стратегии у игроков-профессионалов, игравших с компьютером на первых стадиях саморазвития AlphaGo. На этом обучение ИИ не остановилось, и система продолжила самосовершенствование, сначала подсматривая за онлайн-матчами в Го, а затем и играя сама с собой.
Это позволило AlphaGo достичь рейтинга в 3,1 тысячи эло, что соответствует уровню гроссмейстера международного уровня в шахматах, или профессиональному 3 дану в Го. Сессия игры, которую Сильвер и его коллеги провели между AlphaGo и Фанем Хоем (Fan Hui), чемпионом Европы по Го со вторым даном, завершилась со счетом 5-0 в пользу машины.
«Наблюдая за играми против Фаня Хоя, я был очень впечатлен силой игры AlphaGo, и у меня возникли сложности с определением того, на какой стороне играет компьютер, а на какой – человек, в те времена, когда я не знал, каким цветом играл Хой. До этой серии игр у меня не было и мысли, что компьютер сможет соперничать с профессионалами, а теперь, похоже, что победа машины над топ-игроками является неизбежностью», — заключает Джон Даймонд (Jon Diamond), президент Британской ассоциации Го.
Источник: ria.ru/science/20160127/136608.
Добавил skrt 27 Января 2016
Источник:
Mastering the game of Go with deep neural networks and tree search
Мне лень дискутировать на тему, что ИИ не существует, но с удовольствием послушаю Ваше мнение на тему, что новость не верна.
Имхо — любая игра в которой конечное число вариантов ходов, заранее выигрышна (беспроигрышна) для ИИ весь вопрос в конкретном алгоритме и мощности платформы.
Судя по критике из вики, не подойдёт:
Критика
Существует несколько поводов для критики насчёт использования генетического алгоритма по сравнению с другими методами оптимизации:
Повторная оценка функции приспособленности (фитнесс-функции) для сложных проблем, часто является фактором, ограничивающим использование алгоритмов искусственной эволюции. Поиск оптимального решения для сложной задачи высокой размерности зачастую требует очень затратной оценки функции приспособленности. В реальных задачах, таких как задачи структурной оптимизации, единственный запуск функциональной оценки требует от нескольких часов до нескольких дней для произведения необходимых вычислений. Стандартные методы оптимизации не могут справиться с проблемами такого рода. В таком случае, может быть необходимо пренебречь точной оценкой и использовать аппроксимацию пригодности, которая способна быть вычислена эффективно. Очевидно, что применение аппроксимации пригодности может стать одним из наиболее многообещающих подходов, позволяющих обоснованно решать сложные задачи реальной жизни с помощью генетических алгоритмов.
Генетические алгоритмы плохо масштабируемы под сложность решаемой проблемы. Это значит, что число элементов, подверженных мутации очень велико, если велик размер области поиска решений. Это делает использование данной вычислительной техники чрезвычайно сложным при решении таких проблем, как, например, проектирование двигателя, дома или самолёта. Для того чтобы сделать так, чтобы такие проблемы поддавались эволюционным алгоритмам, они должны быть разделены на простейшие представления данных проблем. Таким образом, эволюционные вычисления используются, например, при разработке формы лопастей, вместо всего двигателя, формы здания, вместо подробного строительного проекта и формы фюзеляжа, вместо разработки вида всего самолёта. Вторая проблема, связанная со сложностью, кроется в том, как защитить части, которые эволюционировали с высокопригодными решениями от дальнейшей разрушительной мутации, в частности тогда, когда от них требуется хорошая совместимость с другими частями в процессе оценки пригодности. Некоторыми разработчиками было предложено, что подход, предполагающий развитие пригодности эволюционирующих решений, смог бы преодолеть ряд проблем с защитой, но данный вопрос всё ещё остаётся открытым для исследования.
Решение является более пригодным лишь по сравнению с другими решениями. В результате условие остановки алгоритма неясно для каждой проблемы.
Во многих задачах генетические алгоритмы имеют тенденцию сходиться к локальному оптимуму или даже к спорным точкам, вместо глобального оптимума для данной задачи. Это значит, что они «не знают», каким образом пожертвовать кратковременной высокой пригодностью для достижения долгосрочной пригодности. Вероятность этого зависит от формы ландшафта пригодности: отдельные проблемы могут иметь выраженное направление к глобальному минимуму, в то время как остальные могут указывать направление для фитнесс-функции на локальный оптимум. Эту проблему можно решить использованием иной фитнесс-функции, увеличением вероятности мутаций, или использованием методов отбора, которые поддерживают разнообразие решений в популяции, хотя Теорема об отсутствии бесплатного обеда при поиске и оптимизации15 доказывает, что не существует общего решения данной проблемы. Общепринятым методом поддержания популяционного разнообразия является установка уровневого ограничения на численность элементов с высоким сродством, которое снизит число представителей сходных решений в последующих поколениях, позволяя другим, менее сходным элементам оставаться в популяции. Данный приём, тем не менее, может не увенчаться успехом в зависимости от ландшафта конкретной проблемы. Другим возможным методом может служить простое замещение части популяции случайно сгенерированными элементами, в момент, когда элементы популяции становятся слишком сходны между собой. Разнообразие важно для генетических алгоритмов (и генетического программирования) потому, что перекрёст генов в гомогенной популяции не несёт новых решений. В эволюционных стратегиях и эволюционном программировании, разнообразие не является необходимостью, так как большая роль в них отведена мутации.
Последний рубеж преодолен: ИИ обыграл человека в Го
Шашки, шахматы и другие «простые» игры уже не являются испытанием для компьютера. Последним рубежом стала китайская игра Го – стратегическая настольная игра для двух игроков. В дуэли между искусственным интеллектом и человеком последний изначально был в более выгодной позиции, так что противостояние должно было оказаться равным. Но теперь кажется, что и этот последний рубеж преодолен.
В октябре 2015 года искусственный интеллект AlphaGo, разработанный Google, победил профессионального игрока Fan Hui, и не в одном, а в пяти матчах. Почему стремительно развивающимся компьютерам потребовалось столько времени, чтобы победить человека, объясняет сложность игры. Например, если из одной шахматной позиции игроку открывается возможность сделать около 20 разных ходов, то в Го этих вариантов около 200. Количество общих возможных ходов в Го превышает количество атомов во Вселенной. Если быть точнее, их число составляет 2,08 × 10 170 – невероятно большое число.
Выбор лучшего хода различными алгоритмами
Можно подумать, что с развитием современных компьютеров, по крайней мере суперкомпьютер должен справиться с такой сложно задачей. Но сложность не только в огромном количестве возможных комбинаций, но и в том, что они должны быть просчитаны в правильной последовательности. Решением стал алгоритм Monte Carlo Tree Search (MCTS), который просчитывает множество последовательностей и случайных ходов в игре. В случае с Го были исследованы партии последних нескольких лет на предмет того, какие фигуры (белые или черные) выигрывают чаще и какая позиция, таким образом, является наиболее удачной. Кроме индивидуальных позиций также важно спланировать следующий шаг. Здесь на помощь приходят прописанные алгоритмы, которые были получены от игроков, из открытых библиотек и баз данных.
Финальная позиция игр между Fan Hui и AlphaGo
Google приобрела компанию Deep Mind два года назад. Разработанная ей программа AlphaGo использует две нейронные сети для планирования ходов. Первая называется Policy Network и выбирает среди 200 комбинаций наиболее удачные. Другая сеть под названием Value Network выбирает из предложенных вариантов лучший способ, который необходим для победы. Все это работает вместе с MCTS и в итоге выбирает лучший ход. После анализа более 30 миллионов ходов, сделанных людьми, самообучающаяся сеть научилась играть сама с собой, чтобы учиться дальше. Таким образом нейронная сеть проходила тренировки с 50 GPU в течение недели.
Кто же лучше играет в Го, компьютер или человек, мы узнаем в ближайшем будущем. В Сеуле марте с AlphaGo сразится, наверное, лучший игрок в Го – Lee Sedol.
AlphaGo одержал новую победу над чемпионом по игре в го
В ходе второй игры искусственного интеллекта с Кэ Цзе — лучшим игроком в мире — компьютер снова победил человека. В какой-то момент Ке показалось, что он очень близок к победе, но он ошибся.
Читайте «Хайтек» в
AlphaGo снова обыграл лучшего в мире игрока в го Кэ Цзе. Несколько дней назад искусственный интеллект уже выиграл поединок у Ке, и теперь по итогам второго матча ИИ подтвердил свое достижение, пишет The Verge.
По словам аналитиков, Ке Цзе играл прекрасно первые 50 ходов и реализовывал свою стратегию — он хотел втянуть AlphaGo в серию сложных битв по всем направлениям. Но ИИ отразил все удары и, в итоге, снова обыграл человека.
По словам Кэ Цзе, эта игра отличалась от предыдущей. Алгоритм сделал несколько ходов, которые оказались для него неожиданными — он не так представлял себе стратегию максимизации вероятности выигрыша. В середине игры Ке подумал, что он близок к победе, однако, он ошибся.
Вертикальные фермы Plenty дают в 350 раз больше урожая
В этом месяце должно состояться еще одно состязание по игре го, в котором будет участвовать искусственный интеллект — он сразится сразу с пятью соперниками одновременно. ИИ очень уверенно обходит лучших игроков в го, а потому ученые уже решили пойти на необычный шаг — в ходе эксперимента они планируют дать человеку небольшую дозу ЛСД и посмотреть, сможет ли он обыграть компьютер в го.
Результат матча – 4:1 в пользу программы AlphaGo
Как же так получилось?
Один из сильнейших российских игроков, а также трехкратный чемпион Европы Илья Шикшин считает, что у обеих сторон были равные шансы в первой партии. По его мнению, очень большую роль в этой партии сыграла психология: Ли Седолю было сложно настроить себя на борьбу с компьютером, потому что раньше профессионалы его уровня побеждали программы, да еще и на нескольких камнях форы. Более того, игрок был недостаточно внимателен, и, возможно, даже не верил в то, что программа может находить наилучшие ходы.
— Все это привело к тому, что игроком были допущены ошибки, которые и привели к поражению в первых трех партиях, – говорит Илья.
Того же мнения и вице-президент Российской федерации Го Максим Александрович Подоляк:
— Очевидно, Ли Седоль испытывает огромный, невиданный ранее, груз ответственности, поскольку он сражается не только за себя, но и за многовековую историю самой сложной интеллектуальной игры. Это мешает в ситуации, когда надо полностью отрешиться от всего. Уверен, что и ожидания Ли Седоля, как и всех нас, по уровню игры AlphaGo были занижены по итогам матча против Фаня Хуэя. Конечно, это был сомнительный трюк со стороны Google – продемонстрировать игру одного алгоритма, а выставить другой. Но сейчас очевидно, что представленный алгоритм существенно сильнее, и для победы над ним даже сильнейшему игроку мира требуются огромные усилия.
По мнению президента Российской федерации Го Максима Аркадьевича Волкова, психологическое давление существенно сказалось на игре Ли Седоля:
— Ли Седоль представляет элиту Го-сообщества, он проверенный и опытный боец. Его проигрыш лично для меня был очень болезненным. Что уж говорить о внутренних переживаниях спортсмена, на которого смотрит многомиллионная аудитория, от которого все Го-сообщество ждет единственного результата. Мне показалось, что ближе к концу первой партии у него задрожали руки, но, может, мне это только показалось. В целом, напряжение было невероятно высоким, а игра протекала с переменным успехом.
На пресс-конференции после завершения первой партии Ли Седоль признал, что уровень игры программы гораздо выше того, который он видел в партиях AlphaGo с Фанем Хуэем, и у них равные шансы на победу в этой серии.
— К четвертой партии Ли Седоль пришел более подготовленным, возможно, он разобрал уже сыгранные партии, – добавляет Илья Шикшин. – Отсюда и результат – профессионал играл практически без ошибок, и партия закончилась в его пользу.
В середине четвертой партии Ли Седолю удалось обыграть программу, совершив неожиданный ход (№78). По словам разработчиков из лаборатории DeepMind, AlphaGo оценивала вероятность появления такого хода на доске как менее 1 к 10 000. По мнению семикратного чемпиона Европы Александра Динерштейна, этот ход Ли Седоля войдет в историю и учебники по Го.
Более того, по замечанию Ильи, в середине четвертой партии, когда уже стало понятно, что программа уступает, AlphaGo стала делать довольно странные ходы. Возможно, это был сбой, может, компьютер «понял», что проигрывает, оценив позицию, но, скорее всего, именно эти ходы и привели к окончательной победе человека, потому что он уже не допускал ошибок.
Четвертая партия стала своеобразным знаком надежды для всех поклонников игры – была создана даже петиция об организации еще двух игр. По мнению создателей петиции, программа Google находилась в более выгодном положении: у нее была возможность изучить стиль игры Ли Седоля и сыгранные им партии до матча, в то время как Ли никогда не играл против AlphaGo.
Пока неизвестно, как отреагируют на эту петицию обе стороны, но уже известно, что программе бросили вызов два игрока из Китая – Ке Цзе, 9 профессиональный дан, и Гу Ли, 9 профессиональный дан, оба играющие не слабее Ли Седоля, но в несколько ином стиле. В том, что, если данные матчи состоятся, они вызовут огромный, возможно, еще больший интерес, сомнений нет. Ведь мы знаем теперь, на каком уровне играет программа, и что она совершает достаточно человечные ходы, но непонятно, насколько человечна она в своих ошибках.
Илья Шикшин считает, что результат возможного матча между китайским профессионалом и AlphaGo во многом будет зависеть от того, когда он состоится:
— Чем больше времени проходит, тем сильнее становится программа – если матч состоится в самое ближайшее время, думаю, у Ке Цзе есть все шансы одолеть AlphaGo. Пока непонятно, есть ли какие-то лимиты совершенствования программы и повышения уровня ее игры, но вполне возможно, что через еще несколько месяцев она станет совершенно непобедимой для человека.
Как отмечает семикратный чемпион Европы Александр Динерштейн, было бы так же интересно посмотреть матч AlphaGo против японского мастера Такемии Масаки, 9 профессиональный дан. Этот игрок, бывший одним из сильнейших игроков мира в начале 1990-х годов, известен своей необычной манерой игры, предпочитая игру на влияние с построением территории в центре доски. Во время прошедших пяти партий профессионалы отметили, что программа тоже предпочитает подобный стиль, и было бы интересно посмотреть, как искусственный интеллект поведет себя в данном случае.
Президент Российской федерации Го М.А. Волков считает, что и европейские профессиональные игроки могут сразиться с AlphaGo и завершить матч в свою пользу:
— Уверен, что, если мы сможем организовать матч с AlphaGo на предстоящем 60-м Полиметалл Европейском Го конгрессе, который пройдет этим летом в Санкт-Петербурге, подобная игра вызовет большой интерес.
В общей оценке результата матча для всего мира эксперты сходятся: серьезный прорыв в области разработок искусственного интеллекта привлек внимание широкой общественности к игре Го. Заслуженный тренер России по Го, профессор, доктор технических наук Владимир Алексеевич Кузнецов добавляет:
— Значимость результата, полученного разработчиками программы, значительно больше: с одной стороны, это значит, что Го – самая удивительная игра, секрет которой почти разгадан человеком, поскольку совсем не обученный компьютер выбирает вполне человеческие ходы, а с другой стороны, победа компьютера означает торжество современных средств искусственного интеллекта. Потрясающе, что это произошло именно с игрой Го, в этом фантастическая уникальность Го, сравнимая с большой теоремой Ферма: она практически бесполезна, но в результате ее 250-летнего доказательства математика получила огромное развитие. Случилось так, что на ней сомкнулись два полюса: физиология мышления человека и новое представление о возможностях компьютера. Сомкнулись стремительно, без постепенного роста.
С данной точкой зрения согласен Илья Шикшин:
— Считаю, что уровень мастерства игроков только возрастет, если в общем доступе появится программа подобная AlphaGo, благодаря которой игроки смогут учиться Го до самого высокого уровня.
Александр Динерштейн считает, что теперь весь мир узнает много интересного и Го в общем:
— В Го существует задача, придуманная в 1713 году известным японским мастером Досетсу Инсеки. Расчет идет на двести ходов вперед. По ней изданы целые книги, но так никто и не смог ее решить. Существуют красивые решения, но они отличаются от изначально объявленного автором задания. Наконец-то мы узнаем, есть ли у этой задачи решение, или, может быть, ошибался сам Досетсу?
Гроссмейстер России по Го, президент Российской федерации Го в 1994-1997 годах Валерий Дмитриевич Соловьев считает, что главная интрига теперь – продолжит ли свои разработки подобного искусственного интеллекта компания Facebook. Напомним, что в начале года основатель Facebook Марк Цукерберг сообщил, что его лаборатория занимается разработкой программы, играющей в Го, и демонстрирует успехи в данном направлении.
— Часто сторона, которой не удалось стать первой, прекращает исследования. Но сейчас крайне интересно, если появятся два суперигрока, созданные разными коллективами. Это приведет к колоссальному прогрессу в игре Го, опять же по аналогии с шахматами. Сильнейшим игрокам есть чему научиться у компьютеров. Я слежу за шахматными турнирами на высшем уровне: нередко гроссмейстеры делают совершенно парадоксальные ходы, свойственные компьютерным программам, противоречащие всем базовым принципам шахмат, которым учат с детства, но которые в данной конкретной позиции оказываются правильными. В шахматах компьютеры раскрепостили мышление игроков, партии стали более интересными, насыщенными нестандартными идеями. Этого я жду и в Го.
«Матч века» несомненно станет началом новой эпохи в истории Го. Так же, как победа Deep Blue над Гарри Каспаровым в 1997 году задала новый этап развития шахмат. Возможно, он приведет к прорыву в теории и методике Го, в обучении Го, возможно даже, что она познает игру глубже человека. Но в любом случае, рост популярности игры гарантирован, что приведет и к росту популярности спортивных турниров и мероприятий, связанных с Го.