

이전 게시글에서도 한 번 짧게 밝힌 바 있는데, 저는 코더로 시작해 Enterprise IT 컨설턴트까지 기업용 IT 환경에서 대략 20년 넘게 일해왔습니다. 데이터 사이언티스트는 아니고, 그렇다고 AI라는 주제에 아주 전문적인 지식을 갖추고 있지는 못합니다. 물론, 평균보다는 이해도가 높은 편이기는 하지만 말이죠.
월가아재님 컬럼 이후 게시판에 AI에 대한 논의에 불이 붙고 있는 듯 하여, 그 동안 한 번 적어볼까 말까 고민했던 제 생각을 짧은 경험과 이해를 바탕으로 적어 보겠습니다. 쓰자고 들면 너무 길고 복잡해 질 것 같아 그냥 안하고 말았었는데 말이죠 ㅎㅎ
먼저 분명히 밝힙니다. 저는 AI 긍정론자입니다. ChatGPT를 처음 접하고 AI가 사람처럼 대화하는 모습을 직접 경험하고 나서 AI 초긍정론자가 된 이들이 시장 참여자 중 다수라고 생각합니다만, 저는 2016년 알파고가 이세돌을 바둑으로 이기기 전부터 AI의 시대는 올 것이라 확신에 가깝게 생각해 왔습니다. 이때부터 투자에 관심을 기울였다면 지금쯤은... 에휴. 어쨌든, AI optimist로의 경력을 따지자면 아마도 시장 참여자 평균 대비 월등히 길다고 생각합니다. 물론, AI의 가능성을 믿고 창업까지 한 Valley AI 분들에 비견할 수는 없지만 말이죠.
왜 AI 긍정론자가 되었느냐? 이 부분이 아마 대다수 사람들과 차이가 있는 부분일텐데, 저는 현재의 머신러닝 기반 AI를 기술이 아닌 사고방식의 혁명이라는 맥락에서 필연적인 미래라고 생각합니다. 즉, 경험과 직관에 근거한 사고와 의사결정에 비해 데이터 기반 사고와 의사결정이 우월하다고 믿기 때문입니다. 경험과 직관이 중요하지 않다는 것이 아니라, 데이터와 증거가 1순위가 되고, 경험과 직관이 2순위가 되어야 한다는 의미입니다.
느닷없이 무슨 소리냐... 고 생각하실 수도 있을 것 같은데, 조금 부연설명을 붙여 보도록 하죠.
머신러닝, 혹은 기계학습의 개념을 먼저 짚고 넘어가야 합니다. 대체 기계가 무슨 학습을 한다는 거죠?
학습의 정의는 너무나 다양하겠으나, 여기서는 맥락에 맞게 정의해 보겠습니다. 우리가 이미 알고있는 것으로부터 새로운 것을 배우는 과정을 학습이라고 합시다. 여기에는 크게 두 가지 방식이 있습니다. 연역적 학습과 귀납적 학습입니다.
연역적 학습이란 주어진 논거를 바탕으로 논리적인 사고를 가미해 결론을 도출하고 새로운 사실을 유추하는 것이죠. 가령, A=B 이고, B=C 라고 합시다. 논리적으로 생각할 때 A=C 라는 사실을 쉽게 유추할 수 있죠. 새로운 사실을 연역적으로 학습한 겁니다. 매우 인간 중심적인 학습법으로 컴퓨터는 이런 방식의 학습을 아예 하지 못합니다. 절대 다수의 사람들이 이 방식에 익숙하며, 다양한 가설을 수립할 때 매우 유용합니다. 다만, 지나치게 관념적으로 치우쳐 현실 세계와 거리가 먼 온갖 궤변과 말 잔치로 이어지게 될 수 있다는 심각한 문제가 있습니다. 고대 그리스 시절 플라톤과 아리스토텔레스가 극혐했던 소피스트들이 이런 사람들이었죠.
귀납적 학습은 철저히 증거에 근거한 학습입니다. 16세기 가장 위대한 인물 중 하나인 프랜시스 베이컨이 사상적 원류라고 할 수 있죠. 앞선 예시를 들어보자면 수많은 과거 데이터 속에서 A=B, B=C 라는 결과는 보았지만, A=C라는 결과를 과거 데이터 속에서 한 건도 찾지 못했다면 귀납적 학습으로는 A=C라는 새로운 사실을 영영 배울 수 없습니다. 그런데, 잘 생각해 보세요. 논리적으로는 분명히 A=C 인 것이 맞는데, 현실 세계에서 그러한 현상이 전혀 관찰되지 않았다면 인간의 논리가 맞다고 봐야 할까요, 아니면 자연 현상이 맞다고 봐야 할까요? 과학자들에게 묻는다면 두 말 할 것 없이 후자가 맞다고 할 겁니다. A=C 는 입증되지 않은 가설이지 팩트는 아닌 거죠.

지금은 모두가 사실로 받아들이는 아인슈타인의 특수 상대성 이론 역시 위 사진에 나온 두 분이 1971년 비행기에 세슘 원자시계를 실어 속도에 따른 시간흐름의 변화를 실험으로 증명해내었기 때문에 과학적 사실이 되었습니다. 이처럼 과학은 가설과 실험의 반복적인 사이클을 돌면서 입증된 사실을 배워나가며 눈부시게 발전해 왔습니다. 귀납적 학습을 인류가 받아들이면서 인류 문명이 눈부시게 발전한 셈이죠.
위 다이어그램이 과학이 새로운 사실을 배워나가는 과정을 보여줍니다. 가설을 세우고, 반복적인 실험을 통해 증거를 모아, 증거 데이터를 분석하고, 가설을 재검증하고, 다시 실험, 증거분석... 이 지난한 과정을 거친 후에도 가설을 입증할만한 믿을만한 증거가 없다면 가설을 폐기하는 것이고, 증거가 확보되었다면 그 속에서 패턴화할 수 있는 규칙을 도출하는 것... 이 과정으로 새로운 것을 학습하는 것이 귀납적 학습이자 과학적 학습입니다.
머신러닝은 바로 이 귀납적 학습, 과학적 학습 방식에 기반합니다. 컴퓨터는 연역적 학습은 전혀 할 수 없지만, 귀납적 학습에는 도가 텄습니다. 애시당초 computer 라는 말 자체가 '계산하는 사람' 이라는 뜻이잖아요? 방대한 데이터를 수집, 정제, 패턴화하기 위한 수학 통계적 방식을 컴퓨터는 어마어마하게 효율적으로 수행할 수 있는 머신입니다. 즉, 머신러닝은 컴퓨터라는 '기계' 가 방대한 디지털 데이터로부터 귀납적인 혹은 과학적인 '학습' 을 수행하는 제반 과정, 행위를 의미합니다.
왜 데이터 사이언스라고 부르는지 궁금해하신 적 없으신가요? 그 이유는 간단합니다. 머신러닝이 곧 데이터로부터 과학적 학습을 수행한다는 말이기 때문이에요. 배움의 주체가 인간이 아니라 기계라는 차이가 있을 뿐입니다.

데이터 사이언티스트를 업으로 하시는 분들이라면 아마도 매우 친숙한 다이어그램일 겁니다. CRISP-DM 이라는 데이터 분석 표준 사이클입니다. 이 사이클은 모든 머신러닝 기반 AI를 만들 때 적용됩니다. 여러분들이 그렇게 좋아하시는 ChatGPT도 마찬가지에요. 이 다이어그램이 앞서 나왔던 scientific method와 거의 동일한 구조라는 점을 눈치채셨다면, 왜 데이터 사이언스라고 부르는지 아마도 감을 잡으셨으리라 생각합니다.
자... 그러면, 앞서 언급했던 내용들까지 모아 차근차근 짚어봅시다. 대략적인 저의 생각은 아래와 같습니다.
머신러닝은 컴퓨터가 데이터에 기반한 과학적 (귀납적) 학습을 수행하는 과정을 의미합니다.
현재 세간의 총애를 받는 AI는 바로 이 머신러닝에 기반하고 있습니다.
데이터에 기반해 과학적으로 학습하고, 학습한 결과를 실행에 옮긴 결과물들이 차별적인 성과를 보여주고 있습니다.
이러한 성과는 앞으로 더 많은 이들로 하여금 데이터 기반 학습과 의사결정을 수용하게 만들 것입니다.
앞으로 데이터 기반 학습과 사고에 능숙한 사람들이 늘어나 저변이 확대됩니다.
점진적으로 과학적 사고와 의사결정이 center stage에 자리잡고, 직관은 보조적인 역할을 수행하게 될 것입니다.
이러한 흐름이 어느 정도 가시화되었을 때 머신러닝 기반 AI는 진정한 경제 전반의 생산성 향상을 가져오게 될 것입니다.
AI optimist가 아닌, 투자자로서 중요한 점은 과연 AI가 경제 전반의 생산성 향상을 가져오는 시점은 언제인가... 가 되겠죠. 당장 올해 혹은 내년이라면 지금이라도 AI에 대한 투자를 멈추어서는 안될 것이고, 최소한 10년, 20년 뒤 먼 미래라고 본다면 지금 시장의 기대치는 높아도 너무 높다고 할 수 있습니다. 결론부터 이야기하자면 저는 후자라고 생각합니다.
그 이유 중 두 가지만 적어보도록 하겠습니다. 생각의 흐름대로 가다 보니 계속 길어지네요. 감안하셔요 ㅎㅎ
먼저 짚고 넘어갑시다. 저는 경제 전반의 생산성이 향상되는 시점에 대해 이야기하고 있습니다. 이를 위해서는 무엇이 필요할까요? 구글 대신 ChatGPT를 활용하는 개인들의 비중이 늘어나는 것? 새로운 갤럭시에 실시간 통역 기능이 추가되는 것? 이런 변화가 전반적인 생산성을 향상시켜 줄까요? 개인 레벨의 새로운 사용자 경험이나 변화가 산업의 전반적 생산성을 향상시킨다?

위 차트는 글로벌 스마트폰 배송량과 선진국의 생산성 향상 추이를 같이 보여줍니다. 우측의 색깔이 들어간 구간을 보면, 2007년 아이폰이 스마트폰 시장을 만들어낸 이후 보급량은 폭발적으로 늘어났습니다. 같은 기간 선진국의 생산성은 곤두박질치더니 2017년 경부터 다시 고개를 좀 들었죠.

위 차트를 보면 G7 국가의 생산성 (시간 당 GDP) 상승률은 대부분 2018년부터 다시 급락했습니다. 그래도 하늘색 선 미국은 짱짱하게 버티고 있습니다만 ㅎㅎ
스마트폰은 인류의 일상을 완전히 뒤바꾸어 놓았습니다. 더 빨리, 더 편하게, 언제 어디서나 다양한 정보를 취득하고 교환할 수 있게 되었죠. 상식선에서 생각해 보면 이러한 모바일로의 거대한 전환이 산업 전반의 생산성을 향상시킬만도 한데, 안타깝게도 그런 일은 벌어지지 않았습니다. 여기서 짚고 넘어가려는 점은 개인 레벨의 새로운 사용자 경험 및 기술의 활용 패턴과 전반적인 산업 생산성 향상은 별개라는 점입니다. 위 차트들이 그 중거 중 하나죠.
그럼 어디를 봐야 할까요? 아무래도 기업이겠죠. 가령, AI로 인해 100명이 하던 일을 10명이 할 수 있게 된다... 좀 과장해서 이런 일이 벌어져야겠죠. 그것도 어떤 한 기업이 아니라 전 산업의 대다수 기업들이 이러한 효과를 누려야 경제 전반적인 생산성 ...

와 이런 글을 매일 몇 개씩 쓰시는 건가요. 정말 놀랍습니다. 매일 더 놀라게 됩니다. 블로그 덕분에 이렇게 좋은 생각과 사고의 흐름을 볼 수 있어서 정말 기쁩니다. 감사합니다! "AI에 의한 산업 전반의 생산성 향상 시점이 당장 가까운 것은 아니지만, 그 시기는 결국 온다." 메모.

아.. 게시판에 과거에 썼던 글들을 전부 블로그로 마이그레이션했습니다. 이 글은 몇 달 전에 썼던 글이에요 ㅎㅎ

그렇군요. 만약 하루에 쓰신 거라면 너무 압도되는 기분이었어요 ㅎㅎ 과한 찬사 일변도로 불편하게 해드리고 싶지는 않은데, 저도 읽고 생각을 말해볼 수 있도록 노력하겠습니다!

ㅎㅎ 부담갖지 않으셔도 됩니다. 쓰면서 제 생각을 정리하는 거라서요.

두번 세번 읽어도 생각의 깊이에 계속 놀라곤 합니다. 마이그레이션 한지 1년이 더 지난 글을 또 읽어봅니다. 감사합니다.

이런 좋은글을 써주시니 감사할따름입니다. 결국에는 지금쓰고있는 AI들의 비용은 낮아지고 성능은 올라가는 타이밍때 치고나가는놈이 승자가 아닐까 생각은되는데 주가오르는거보고 참는게 쉽진않네요 ㅎㅎ 잘보고갑니다