Игра, похожая на жизнь.


Александр Битман ,
март, 2003 год.
alex-361@mail.ru


Об авторе: Александр Битман — соавтор знаменитой шахматной программы „Каисса“, мастер спорта по шахматам с 1969г., любитель игры Го с 1979г.
С некоторыми сокращениями эта статья была опубликована в журнале „Компьютерра“ № 9, за 2003 год.

Шахматы и Го — интеллектуальные игры с достаточно сбалансированными элементами стратегии и тактики, чем и объясняется их привлекательность и живучесть (шахматам около 500 лет, Го примерно 4000 лет). В то же время это игры–антагонисты по духу, по ментальности (Запад — Восток), по вкусовым ощущениям. Вот только некоторые, чисто внешние, отличия Го от шахмат.

Если же говорить об эмоциональном восприятии, то Го завораживает, очаровывает и безнадежно влюбляет в себя каждого, кто терпеливо пройдя стадию обучения, сыграл хотя бы раз партию на большой доске, в настоящее Го, с настоящим Мастером игры.
В Го каждый человек может найти и проявить себя в полной мере. Для одних, партия в Го — это ритуал и почти медитация, для других — радостный и, одновременно, мучительный творческий процесс, нечто вроде интеллектуального наркотика, для третьих — суровая и бескомпромиссная борьба, укрепляющая волю и силу духа. Но во всех случаях Го притягивает своей глубиной, таинственностью и внятно осязаемой головокружительной сложностью.

С точки зрения общей теории игр Го и шахматы устроены одинаково — это игры с полной информацией. В каждой из них имеется конечное число состояний (позиций) и, согласно теореме Цермело, в любой позиции существует лучший ход, возможно, не единственный. Тем самым исход игры из любой позиции, в том числе и начальной, предопределен. В шахматах таким исходом будет, скорее всего, ничья, что подтверждается турнирной практикой, хотя строго доказать это вряд ли возможно.
В Го ситуация иная, там существует компенсация за право выступки (первого хода), измеряемая в очках, так называемое коми. Величина этого коми должна быть в точности равна тому количеству очков, которое выигрывают черные (они начинают партию) в результате оптимальной игры обеих сторон. Поэтому теоретически, игра Го ничейна по определению. На практике же, все получается ровно наоборот.
Мы не знаем исхода оптимальной партии, его знает только Бог. По этой причине величина коми устанавливается, исходя из многолетней практики ведущих игроков–профессионалов. Поскольку мы все равно не знаем точного значения коми, то его полагают дробным, а Го становится, соответственно, боевой игрой, где нет ничьих. Справедливости ради надо сказать, что и в случае целого коми вероятность ничьей в партиях профессионалов была бы не более 1/30, а в партиях любителей и того меньше. Долгое время значение коми принималось равным 5.5 очка, но в последние годы под влиянием корейских профи и с учетом статистики перешли на коми 6.5 очков.
Можно отметить, что правила Го гораздо проще шахматных правил. Они проще не только для человека, но и для машины, вернее для программной реализации ее способности играть, т.е. просто исполнять ходы. В то же время нужно сказать, что в человеческом восприятии правила Го в некотором смысле неадекватны самой игре, и ознакомление с ними не дает никакого представления о характере тех проблем, которые приходится решать по ходу партии. Если двое начинающих будут играть только между собой, они рискуют до конца жизни остаться неандертальцами в Го.
Незамысловатые правила Го напоминают известную компьютерную игру „Жизнь“. Фактически они регламентируют только процедуру взятия камней — и всё! А дальше на этом пустом месте непостижимым образом возникает надстройка исключительной красоты и убеждающей силы, которая с полным основанием может считаться моделью жизни. Японцы так и говорят: „Го учит жить“.
Камни выступают в роли примитивных организмов некоей популяции, которая борется за жизненное пространство в условиях конкуренции. Из правила взятия камней с необходимостью вытекает принцип выживания группы — возможность образования двух „глаз“, совсем как в живой природе.
События на доске развиваются по законам какой-то изощренной и в то же время рафинированной логики. Человек, играющий в Го, пытается выработать линию поведения, совместимую с этой логикой, но то и дело сбивается с пути. По этому поводу даже имеется сентенция: „Если верно, что люди учатся на своих ошибках, то игроки в Го — самые упорные ученики“.

Переходя к проблемам программирования Го и шахмат, можно сказать, что и здесь они во многом расходятся. При создании игровых программ в любом случае приходится вести перебор вариантов, используя усеченное дерево игры. Главная цель — провести как можно более глубокий перебор и уметь при этом достаточно адекватно оценивать возникающие позиции. Перебор может быть неравномерен по глубине, но важно побыстрее избавиться от мусора и определить те содержательные ветви дерева, которые будут критическими для принятия окончательного решения. Так мыслит и действует человек, когда производит селективный отбор, используя интуицию и опыт.
У машины нет интуиции, а базы сыгранных партий — не совсем тот опыт, который здесь нужен. Помочь машине сократить перебор можно двумя способами. Первый, чисто технический, — использовать различные эвристики и алгоритмы (типа альфа–бета–процедуры), не выплеснув при этом ребенка, т.е. не потеряв лучшего решения. Второй состоит в попытке подражать человеку и пытаться хотя бы в некоторых позициях дерева игры проводить селекцию ходов–кандидатов, чтобы вести узконаправленный перебор.
Так, собственно и действуют многие программы. Однако качественный отбор ходов — задача, сравнимая по сложности и трудоемкости с исходной, и в этом состоит цена вопроса. Для многих игр оказалось легче организовать широкий перебор, который практически решает задачу, а не стрелять из пушек по воробьям, тем более, что „пушки“ еще как следует не налажены.
Почему же существует такой разрыв между уровнем игры шахматных и Го–программ?
В шахматах имеется набор факторов, которые достаточно адекватно позволяют оценивать и сравнивать возникающие в процессе перебора позиции. Это — соотношение материала, подвижность фигур, контроль центральных полей, особенности пешечной структуры и т.д. Поэтому при достаточно глубоком переборе качество, а главное, надежность выбираемого шахматной программой хода оказались вполне сравнимы с возможностями человека. Как только растущая производительность компьютеров позволила им вести перебор со скоростью нескольких миллионов ходов в секунду, выяснилось, что шахматы устроены не намного сложнее, чем крестики–нолики или шашки.
В Го, напротив, трудно формализовать многие факторы и понятия, от которых эта оценка зависит. Трудно определить не только силу или слабость группы камней, но и само понятие группы. Трудно оценить силу влияния камней, понять, в какое число очков эта сила может трансформироваться, и т.д. Стоит подчеркнуть, что это никак не связано с правилами игры, эти понятия вторичны, так же как в шахматах, например, вторичны понятия слабый пункт или проходная пешка. Очень сильно усложняет оценку позиции и тот факт, что в Го существует так называемая ко–борьба — изюминка игры, выводящая ее как бы в другое измерение. Все существующие программы панически ее боятся и стараются избегать, но это не всегда возможно.
Отметим еще несравнимо меньшую, чем в шахматах зависимость хода игры от разработанных схем в начале и середине партии.
Похожие трудности, однако, испытывают и люди, потому что Го при ее изначальной простоте оказывается очень глубокой и содержательной игрой, совершенствоваться в которой можно всю жизнь. Не зря шкала искусства игры имеет в Го около 40 градаций, и это только для любителей, а дальше начинается иерархия профессиональных данов.
В Го больше, чем в шахматах, работает интуиция. Человек созерцает картину разворачивающегося на доске противоборства сторон, оценивая гармоничность как отдельных форм, так и стратегических построений в целом. В некоторые моменты он принимает решение, не ведя утомительного и даже бесполезного расчета, а полагаясь на некоторые общефилософские принципы игры, так называемые заповеди Го. Недаром в Японии Го называют искусством гармонии, а также „самой пленительной в мире игрой“.
Среди причин, которые усложняют Го–программирование, обычно называют еще две: большую размерность и некоторую неоднозначность правил. Просторы доски 19х19, действительно, не оставляют шансов для грубого перебора, однако, и на доске 9х9, соизмеримой с шахматной, добиться успеха пока не удается. Что же касается существования в Го некоторых иррациональных позиций, то это никому еще не мешало играть в Го или создавать компьютерные программы, и мнение, что это усложняет задачу, является чистым мифом.
При создании шахматных программ обошлись грубой силой — дело так и не дошло до инструментария, ассоциируемого у нас с ИИ — нейронных сетей, распознавания образов, самообучения. Однако, в отношении Го лобовая атака успеха не принесла, и попытки создать программу, играющую хотя бы на уровне среднего любителя, остаются безуспешными вот уже более 40 лет.
В этом, собственно, и состоит загадка древней игры и вызов, брошенный ей человеческому интеллекту: надо либо засучить рукава и всерьез заняться Го с позиций ИИ, либо лет 30 ждать и надеяться на прогресс в электронике, и еще не факт, что это поможет. Можно еще рассчитывать на помощь инопланетян, памятуя, что существует версия о внеземном происхождении Го…
Коль речь зашла о загадках Го, вот еще одна, на этот раз вполне земная. Почему ни один европеец, или более широко, „белый человек“ не может достичь уровня игры профессионалов, не обучаясь в течение нескольких лет в Японии или Корее? Если сравнивать с шахматами, то гроссмейстерами, не приезжая в СССР, становились где угодно, вплоть до Кубы и Филиппин.
В минувшем году, кстати, произошло знаменательное событие — в России появились первые профессионалы. Александр Динерштейн и Светлана Шикшина после 4–х летней стажировки в Сеуле получили 1–й профессиональный дан. В этом же году на Европейском Го–конгрессе в Загребе Саша стал в третий раз чемпионом Европы, а чуть позже в Сеуле Света сотворила сенсацию, обыграв профессионала 5–го дана. Кстати, и Динерштейн, и Шикшина имеют свои странички в Интернете.
Интерес в мире к феномену Го в последнее время постоянно растет. Недавно газета „Нью–Йорк Таймс“, поместила статью, в которой, упоминая о победе DeepBlue над Каспаровым, ставит как научную проблему, создание Го–программы, способной противостоять человеку.
Эммануил Ласкер, бывший чемпион мира по шахматам, столкнувшись с Го, назвал ее космической игрой, игрой будущего. Сейчас Го все чаще называют игрой 21–го века. В Сеуле в 2001 году была проведена 1–я Международная конференция по Го, организованная университетским департаментом, который целиком специализируется на изучении Го.
Показательно, что многие известные фирмы, среди которых LG, Samsung, Toyota, Fujitsu и другие, являются организаторами и спонсорами международных турниров по Го в своих странах и за их пределами. Так, фирма LG ежегодно организует в Москве розыгрыш “LG Cup”, на который съезжаются более 400 участников из России и стран СНГ. Фирма заключила контракт с профессионалом 9-го дана, который проводит регулярные занятия с ее ведущими сотрудниками. Руководство LG считает это лучшим способом повышения квалификации своих менеджеров и управленцев, что, кстати, является общепринятой практикой в Корее.
Название игры Го, имеет японское происхождение. В Корее игра называется „Бадук“, в Китае — „Вейчи“. Поэтому, когда в Москве проводились „Кубок китайского посла“ или турнир LG, пришлось освоить новые термины, которые теперь уже стали привычны, и не исключено, что Российская федерация Го может изменить свое название.

Усилия в области Го–программирования неизбежно вызовут дополнительный интерес к познанию закономерностей и механизмов самой игры. В России, с ее проблемами, пока мало надежды на регулярную поддержку таких исследований, но любое интересное продвижение в Го–программировании (даже для доски 9х9) найдет отклик в мире и даст коммерческую отдачу.
Создание хорошей Го–программы — слишком трудоемкая работа для одиночки, к тому же необходим постоянный обмен идеями. На группу разработчиков достаточно 1–2 хороших игроков в Го и возможности консультаций с профессионалами. Успех будет зависеть в основном от творческого потенциала программистов.

Статья прислана для публикации 3 мая 2003 года.