2016년 3월 8일 화요일

알파고, 첫수는 대부분 '화점'… 돌 던지는 예법도 안다


내일 이세돌 對 인공지능 대국… 알파고는 어떻게 바둑을 두나

- 수학문제 풀듯 신경망 활용
원리 배운뒤 기보 16만건 입력
다음 착점 알아맞히며 '연습풀이', 가상 대국으로 최선의 수 찾아내
감정이 없어 무리수도 안 둬… 끝내기선 실수 저지르지 않아

이세돌 9단과 구글의 인공지능 바둑 프로그램 '알파고(AlphaGo)'의 대결이 하루 앞으로 다가왔다. 일어날 수 있는 경우의 수가 무한대에 가까운 바둑은 20~30년간은 인공지능이 프로 기사를 이길 수 없다는 전망이 지배적이었다. 하지만 알파고는 지난해 10월 프로 기사 판후이 2단과 대결해 5대0으로 승리하고, 세계 최강인 이세돌 9단에게 도전장을 던졌다. 어떻게 알파고는 최강의 인간까지 넘보게 됐을까.

바둑 실력은 어디에서 나오나

바둑은 흑과 백으로 편을 나누어 가로·세로 각 19줄인 바둑판에서 승패를 겨룬다. 돌과 돌을 연결해 '집'을 많이 확보한 쪽이 승리한다. 바둑을 잘 두려면 수읽기, 직감, 평정심이 조화를 이뤄야 한다.

수읽기는 계산 능력이다. 수를 둘 때마다 앞으로 벌어질 수 있는 여러 시나리오를 머릿속에서 상상으로 진행해 볼 수 있어야 한다. 직감은 추상적 능력이다. 바둑에서는 모든 경우의 수를 계산할 수 없기 때문에 사람은 직감을 우선적으로 활용한다. 프로 기사들은 다음 착수할 곳을 한눈에 두세 곳으로 압축해 수읽기를 진행한다.

평정심은 바둑을 그르치지 않는 데 필요하다. 앞서 두었던 수가 아까워서 작전을 바꾸지 않고 고집하거나, '당했다'는 느낌에 발끈해서 무리한 수를 두면 안 된다. 알파고는 감정이 없어 평정심을 잃지 않는다.

첫수는 화점에 둘 듯

알파고는 판후이 2단과 벌인 공개 대국에서 다섯 번 모두 첫수를 화점(花點·바둑판에 찍힌 9개의 점)에 놓았다. 이는 현대 바둑에서는 화점을 활용할 때 승률이 높다는 통계에 근거한 결정으로 보인다.

알파고의 대국 스타일 정리 표
바둑의 초반 진행인 포석(布石)도 평범하다. 돌이 거의 없는 초반에는 계산할 경우의 수가 너무 많기 때문에 형세 판단 없이 기보 16만건에서 학습한 대로 둘 것이다. 16만건에서 평균적으로 가장 많이 등장하는 형태를 포석에 쓸 가능성이 높다.

사람은 직감으로 다음 수를 둘 후보를 추리지만, 알파고는 직감이 없다. 대신 바둑판 위에 놓인 돌의 전체적 모양을 읽어 직감을 흉내 낸다. 돌과 돌이 연결된 모양을 감안해 '좋은 모양 만들기'를 하는 것이다.

시뮬레이션으로 이길 확률 따져

대국이 중반에 접어들면 알파고는 사람의 뇌 구조를 모방한 신경망(神經網)을 본격 활용한다. 알파고의 신경망에는 지금까지 학습한 결과가 담겨 있다. 바둑의 규칙과 기본 원리를 배운 뒤, 입력된 기보 16만건에서 다음 착점을 알아맞히는 연습 문제 풀이까지 했다.

이어 가상으로 대국을 무수히 진행해 어떻게 두었을 때 더 좋은 결과가 나왔는지 학습했다. 마치 학생들이 수학을 배울 때 몇 가지 공식을 외우고, 연습 문제를 푼 뒤 증명 방법까지 찾아내는 과정과 닮았다.

하지만 이렇게 많이 학습해도 실제 바둑에서 나올 수 있는 모든 경우를 알 수는 없다. 그래서 대략적 시뮬레이션을 돌려서 승률이 높은 쪽을 선택해 착점한다. 돌이 놓인 모양을 읽어 다음 수 후보를 몇 가지 추린 뒤 시뮬레이션(모의실험)을 돌려서 각 수별로 승리할 확률을 따지는 것이다.

끝내기에는 실수가 없다

알파고도 실수를 한다. 판후이 2단과의 두 번째 대국에서 사활(死活) 문제를 실수하면서 잡을 수 있던 돌을 놓쳤다. 다섯 번째 대국에서는 엉뚱한 수로 자신의 돌을 위험에 빠뜨렸다. 이는 국지적인 전투에서도 충분히 계산을 하지 못해 예쁜 모양을 고집하는 알파고의 특징 때문으로 추정된다. 모양을 버리고 실리를 택할 수 있지만, 알파고는 아직 모양과 실리의 균형을 조정할 정도의 능력은 없는 것으로 보인다. 두 수 모두 프로 기사라면 결코 하지 않을 실수였다.

종반 끝내기에서는 실수가 거의 없을 가능성이 높다. 경우의 수가 줄어 정확한 시뮬레이션 결과를 얻을 수 있기 때문이다.

많은 사람은 이세돌 9단이 대국에서 엉뚱한 수를 놓으면 알파고가 오작동을 일으킬 것으로 기대한다. 하지만 가능성이 낮다. 수많은 기보를 학습했고 가상 대국까지 한 알파고의 실력을 감안하면, 엉뚱한 수는 무시하거나 호되게 응징할 것이다.

불계패도 인정할 만큼 예절을 안다

바둑에서 승패가 기울었다고 판단되면 돌을 던지는 것이 예의다. 상대방 실수를 기다리며 판을 끌고 가지 않는다. 알파고도 예절을 안다. 판후이 2단과 벌인 비공식 대결에서 한 번 불계패를 기록했다. 이길 수 없다고 판단, 프로 기사처럼 행동한 것이다.

 조선일보

댓글 없음: