데미스 하사비스, 무한의 기계를 설계한 사람 part 3.

지금 지구에서 가장 영향력이 큰 사람들이 누구일까요? 트럼프, 일론 머스크, 샘 알트먼..

많이 드러나지는 않지만, 구글딥마인드의 수장인 데미스 하사비스도 인류의 미래를 만드는 사람 중 하나일 겁니다.

저는 기업 창업기나 중요한 인물들의 전기를 읽는것을 즐겨합니다. 본질을 이해하는데 도움이 된다고 생각합니다.

아직 한국에는 출간 전 이지만 (번역중이라는 소식을 들었습니다), 데미스 하사비스 전기 [The Infinity Machine (무한의 기계)]를 먼저 읽어보고 최대한 자세하게 아티클로 작성해보았습니다.

5 part 중 part 2 입니다. 내용이 길지만, 저는 재미있다고 생각합니다... ㅎㅎ

알파고의 37수, 이세돌의 78수 - 목표는 바둑이 아니라 그 너머의 과학

2016년 3월 9일, 서울. 한 어두운 방의 검은 가죽 의자에 딥마인드의 아자 황(Aja Huang)이 앉았습니다. 그의 앞에는 19줄의 격자가 있는 바둑판이 놓여 있었습니다. 왼쪽에는 알파고의 수 선택을 보여주는 컴퓨터 스크린이 있었고, 그 수들은 태평양 건너편 서버에서 계산되고 있었습니다. 그의 맞은편에는 이세돌이 앉았습니다.

이세돌은 자신감을 가지고 있었습니다. 알파고의 이전 경기, 즉 2015년 10월 유럽 챔피언 판 후이와의 대국 기보를 분석한 결과 5-0이나 4-1로 자신이 이길 거라고 예측했습니다. 대부분의 바둑 프로들도 동의했습니다. “딥마인드를 이기는 건 톱 프로가 바랄 수 있는 가장 쉬운 100만 달러”라고 말하는 사람들이 있었습니다.

“인간 지능을 보호하기 위해 최선을 다하겠습니다.” 이세돌이 진지하게 약속했습니다.

전 세계 2억 명이 이 대국을 시청했습니다. 카스파로프 대 딥블루 대국의 두 배가 넘었고, 슈퍼볼보다 많았습니다. 거리 곳곳에 거대 스크린이 설치됐습니다.

게임이 시작된 지 몇 분 만에 인간이 곤경에 빠졌습니다. 이세돌은 비정통적인 세 번째 수와 즉각적인 충돌로 알파고를 혼란시키려 했습니다. 일부러 컴퓨터의 훈련 세트 바깥의 전략을 시도했습니다. 그러나 알파고는 동요하지 않았습니다. 시스템은 5개월 만에 인간 수준의 기능에서 무적으로 진화했었고, 이세돌은 그 발전 속도를 과소평가했습니다.

이세돌은 충격받고, 웃겨하고, 어둡게 받아들이는 모습을 번갈아 보였습니다. 의자에 등을 기대고 미소 지었습니다. 목을 마사지하기도 했습니다. 그리고 결국 그가 항복했습니다. “알파고가 그렇게 완벽한 방식으로 게임을 할 거라고 예상하지 못했습니다.” 그가 게임 후 기자회견에서 고백했습니다.

다음 날 두 번째 게임에서 그는 다른 전략을 시도했습니다. 신중하게 두면서 알파고가 실수하기를 기다렸습니다. 36수 만에 그는 담배를 피우러 잠깐 자리를 비웠습니다. 그가 자리를 비운 사이 알파고가 37번째 수를 두었습니다. 거의 비어 있는 영역에 검은 돌 하나, 이세돌의 우측 측면을 노리는 한 수.

이세돌이 돌아와 그 수를 보는 데 12분이 걸렸습니다. 그는 그런 수를 본 적이 없었습니다.

다른 방에서, 세계 톱 서양 바둑 플레이어 마이클 레드몬드(Michael Redmond)가 비디오로 게임을 따라가고 있었습니다. 그도 당황했습니다. 알파고가 선택한 자리에 검은 돌을 놓아봤다가 다시 빼냈습니다. “아니, 그건 말이 안 돼.” 그가 중얼거렸습니다. 다시 화면을 확인하고, 그 이상한 자리에 돌을 다시 놓았습니다. “좋은 수인지 나쁜 수인지 모르겠어요.” 그가 라이브 스트림 시청자들에게 고백했습니다.

그것은 위대한 수였습니다. 게임이 100수 후에 끝났을 때, 37번째 수가 결정적이었음이 드러났습니다. “이 수를 봤을 때… 알파고가 창의적이라고 확신했습니다.” 이세돌이 게임 후 기자회견에서 말했습니다. “정말 할 말을 잃었습니다.”

다음 날은 휴식일이었습니다. 딥마인드 과학자들이 도시를 산책하다 신문 가판대에서 멈췄습니다. 모든 신문 1면에 알파고가 있었습니다. 한 젊은 여자가 데미스를 알아보고 그가 팝 아이돌인 것처럼 기절하는 시늉을 했습니다.

세 번째 게임에서도 기계가 이겼습니다. 이세돌은 자기 인생 최고의 바둑을 두고 있었지만, 알파고가 그를 능가했습니다. 4번째 게임에서, 그는 78수—후일 “신의 한 수”로 불리게 되는 수—로 깜짝 놀라운 역전승을 만들어냈습니다. 알고리즘적으로 절망적이 된 알파고는 환각을 보기 시작했고, 무의미한 수를 두기 시작했고, 결국 항복했습니다. 이세돌은 흥분했고, 인간이 아직 굴복되지 않았다고 말했습니다. 플로리다의 한 컴퓨터 프로그래머는 한쪽 팔에 37수, 다른 팔에 78수를 문신으로 새겼습니다.

이때 데미스의 동료 토르 그라펠(Thore Graepel)이 한 인터뷰에서 한 말이 결정적입니다. “초기 버전의 우리 바둑 시스템은 인간처럼 두었어요. 인류가 수천 년 동안 학습한 특정 전략을 다시 발견했죠. 우리에게는 매우 안심이 되는 일이었습니다.”

“그런 다음, 그 시스템은 시간이 흐른 인간의 전략들이 사실 반박될 수 있다는 걸 발견했어요. 그래서 그것들을 버렸죠.”

“그리고 시스템이 더 강해지면서, 우리가 본 적 없는 방식으로 두기 시작했어요. 완전히 외계의 스타일이었어요.”

시리즈가 끝난 뒤 한 한국 바둑 평론가가 데이비드 실버에게 다가와 실버의 손을 잡고 이렇게 말했습니다. “당신은 내가 본 가장 아름다운 것을 만들었습니다. 저는 45년 동안 바둑을 두었지만, 오늘 알파고가 둔 수들은 제가 평생 꿈꾸던 아름다움을 넘어섰습니다.”

이 이벤트가 마무리 되고 한참 후. 실버가 신혼여행 첫날 밤 시차에 적응하지 못하고 호텔 침대에서 문득 떠올린 것이 바로 알파고 제로(AlphaGo Zero)의 아이디어였습니다. 인간 데이터 없이 강화학습만으로, 자기 자신과 대국하면서 처음부터 배우는 시스템.

2017년 10월 발표된 알파고 제로는 인류에게 충격을 주었습니다. 3일 만에 알파고 제로는 이세돌을 이겼던 원조 알파고를 이기기 시작했습니다. 40일이 지나자, 인류가 4천 년 동안 축적한 바둑의 모든 지혜를 넘어섰습니다. 더 놀라운 것은 알파고 제로가 발견한 새로운 정석들이었습니다. 인간 바둑계가 수백 년 동안 당연시해온 정석 몇 가지를 알파고 제로는 비효율적이라며 폐기했고, 완전히 새로운 전략들을 제시했습니다. 이어 발표된 알파제로는 바둑뿐 아니라 체스와 쇼기까지 학습했고, 체스에서는 당시 세계 최강의 엔진 스톡피시를 압도했습니다.

이 지점에서 하사비스의 인생이 다시 한번 원점으로 돌아옵니다. 여섯 살에 전화번호부 위에서 체스를 두던 소년이, 42세에 자신이 만든 AI가 체스의 모든 인간적 지혜를 넘어서는 모습을 지켜보게 된 것입니다.

대중에게 알파고는 게임 승리였습니다. 하사비스에게 게임은 결코 목적이 아니었습니다. 바둑판은 그저 통제된 훈련장이었습니다. 그는 이세돌 대국 직후 인터뷰에서 이렇게 말했습니다. “우리는 바둑을 풀기 위해 이 회사를 만든 것이 아닙니다. 우리가 원하는 것은 이 기술로 의학, 기후, 재료 과학, 우주를 풀어내는 것입니다.” 이 선언은 허풍이 아니었습니다. 알파고의 승리로부터 4년 후, 딥마인드는 알파폴드를 발표하게 됩니다.

알파고가 AI 산업 지형에 큰 영향을 미쳤습니다. 글로벌 AI 스타트업에 대한 벤처캐피털 투자가 2016년 직후 두 배 이상으로 늘었습니다. 시진핑이 직접 알파고 사건을 언급하며 2017년 7월 차세대 AI 발전 계획을 국가전략으로 공식화했습니다. 머스크와 알트만이 오픈AI를 세운 배경에는 딥마인드의 AGI 독점에 대한 우려가 있었습니다. 구글 내부의 AI 우선순위가 재편됐고, AI 인재 전쟁이 본격화됐습니다.

“과학을 하는 것은 신의 마음을 읽는 것” — 단백질의 암호를 풀다

케임브리지 학부 시절의 어느 점심, 한 생물학자 친구가 데미스에게 지나가는 말로 단백질 구조에 대해 이야기했습니다. 만약 단백질의 모양을 정확히 그릴 수 있다면 의학 혁명이 일어날 거라고. 모든 신약 개발 시간이 10분의 1로 줄어들 거라고. “하지만 그건 아마 영원히 불가능할 거야.” 친구의 기억에는 남지 않을 만큼 짧은 대화였지만, 데미스의 ...