프리미엄
예측대회
투자분석
아카데미
커뮤니티
로그인Valley AI 시작하기시작하기
Valley Space인기
협상에 관하여
대한민국3대진미홍진미채기본게시판

협상에 관하여

avatar
호옹이
2026.04.01조회수 2,678회
avatar
호옹이
구독자 2,280명구독중 50명
대한민국 3대 진미 진미채 홍진미 홍진채

현재 미국-이란 전쟁을 보면서 다양한 담론이 오가고 있고, 짧게 한 숟갈 생각을 얹었는데, 여기서도 꼬리에 꼬리를 무는 생각이 이어져서, 아 역시나 말을 시작하지 말았어야 했나 싶었지만, 그래도 이왕 시작했으니 뭔가 이야기를 이어가야 할 것 같다.


하나의 국제정세 이벤트가 일어날 때에는, 언제나 다양한 층위의 압력이 존재한다. 인간 조직이 움직이는 방식은 생각보다 쉽지 않아서, 어떤 '미친' 리더가 있다 해서 그 조직이 다같이 미쳐 날뛰지 않는다. 조직이 무언가를 하기 위해 조직적으로 움직인다는 것은 꽤 어려운 일이라, 일이 그렇게 되게끔 만드는 다양한 구조적이거나 산발적인 압력이 존재하게 마련이다. 다시 말해, 이벤트의 원인을 설명하는 그럴싸한 이유 한두 개를 발견했다 해서, 그것이 다른 층위를 배제하지 못한다는 거다. 그걸 이야기하고자 했던 게 지난 글


오늘은 협상이라는 행위 자체에 대해서 이야기해보자.


한국인들은 여러 방면에서 뛰어난 역량을 가지고 있고, 현대 사회는 그 역량이 각 분야에서 빛을 발하고 있어서 매우 뿌듯하다. 그러나 한편으로는 한국인이 '평균적으로' 유독 취약한 역량이 몇가지 있는데, 그중 하나가 협상이다. (신기하게도 외교부에서는 나름대로 협상을 잘한다. 어느 나라에든 특출난 역량을 지닌 사람은 있게 마련이고, 다행히도 협상을 할 줄 아는 희귀한 인재들이 외교부에서 일하고 계시는 것 같다. 짧은 경험에 비추어 보자면 한국의 고위 행정가들의 역량은 생각보다 뛰어나다.)


한국인들은 협상에 대해서 상당히 단층적으로 이해하고 있는 것 같다. 두 사람이 협상 테이블에 앉아서, 체스를 두듯이 서로 수를 하나씩 내놓고, 주거니 받거니 양보를 하다가 어느 지점에서 타협을 하고, 더 많이 양보한 사람이 패배자가 되고 더 많이 얻어낸 사람이 승리자가 되는 식.


뭐 이것도 틀린 말은 아닌데. 실제 협상이라는 건 이보다 훨씬 복잡하고 다양한 층위에서 이루어진다. 그리고 협상에서 누가 이겼느냐 졌느냐도 사실 굉장히 모호하다. 협상이라는 건 한 번에 끝나는 단발성 이벤트가 아니라, 계속 이어지는 '과정' 중의 한 '표면'이라고 생각하는 게 사실에 더욱 부합할 것이다.


참고로, 나는 협상 전문가가 전혀 아니며, (대부분의 한국인이 그렇듯) 살면서 협상이란 걸 해본 경험이 많지도 않다. 그래도 최근의 판을 보아하니 평균적인 한국인보다는 좀 더 할 이야기가 있겠다 싶어서 이 글을 적는 것이며, 본인이 협상에 대해서 좀 안다고 생각하는 사람은 이 글에서 새롭게 얻을 것이 전혀 없을 것이기 때문에, 여기서 이 글을 닫고 나가는 것을 권한다.


이 글이 기여하는 바가 있다면, 한 국가의 지도자를 미치광이로 규정짓지 않고서는 이 현상이 도저히 해석되지 않는 사람들에게, 세계관을 확장하는 데에 조금은 기여할 수 있을 거라는 생각이다. 참고로, 한 국가의 지도자를 미치광이로 규정하는 것 이외의 세계관에 관심이 없는 사람 또한 지금 당장 이 글을 닫고 나가주기를 바란다. 그리고 내 계정을 차단하고 다시는 이 자리에 발을 들이지 않기를 바란다. (나는 기본적으로 세상을 선악으로 판단하는 것에 상당히 보수적인 입장이다. 내가 인정하는 몇 안 되는 '악한 사람'은 '자국민을 학살한 지도자' 정도이다. 누군가를 선과 악으로 쉽게 가르는 사람은 기본적으로 나와 대화가 안 통할 가능성이 높으니, 내가 무슨 말을 하더라도 불편한 감정을 느낄 것이다. 당장 나가길 권한다.)

테이블에 앉기 전까지

협상 테이블에 앉는 일은 쉬운 일이 아니다. 상대방이 협상 테이블에 앉아 있다는 사실은, 그 자체로 매우 많은 걸 이야기한다. 상대방이 나로부터 원하는 바가 있으며, 그것을 얻기 위해서 무언가를 줄 생각이 있으며, 그 과정을 대화로 풀어가고자 하는 의지를 표명한 것이다. 그리고 나와 상대방 양자 사이에 그러한 커뮤니케이션이 맞닿아서, 그가 협상에 임할 의지가 있다는 것을 내가 안다는 것을 상대방이 안다는 것이다. 그 반대도 마찬가지.


두 행위자가 서로에게서 주고받을 게 있다는 건 생각보다 굉장히 희귀한 일이다. 내가 대뜸 어디엔가 취업을 하겠다고 해보자. 저 회사에 빈 자리가 있어야 하고, 그 자리에 필요한 역량을 내가 갖추고 있어야 하고, 그 사실을 내가 알고 상대방도 알아야 한다. 내가 에스엠엔터의 아이돌이 되고 싶다고 찾아가서 문을 두드린다 한들, 누가 귀기울여주겠는가. (내 최애는 윈터다.)


미국이 작년 4월 2일에 던진 관세 전쟁은 협상이다. 협상 테이블을 벌렸으니 협상안을 가지고 테이블로 오라는 뜻이다. 많은 국가들이 협상 테이블에 앉았고, 협상이 이루어졌다. (협상의 이행은 또 다른 이야기다.) 당시에 수많은 호사가들이 미국이 제시하는 관세 공식이 틀렸음을 지적했다. 무의미하다. 미국은 계산을 정교하게 할 필요가 없다. 정교한 계산은 약자들이 하는 것이다. 중요한 건 누구의 공식이 '옳으냐'가 아니다. 협상 테이블에 앉아서 얼마의 가격을 제시하느냐이다. 서로가 감당할 수 있으면 합의가 되는 거고, 아니면 안 되는 거다.


미국이 베네수엘라 대통령을 체포한 것은 협상이 아니다. 그냥 행동이다. 협상 테이블에 앉을 필요가 없었다. 미국은 2025년 내내 마두로를 압박했지만, 마두로는 협상 테이블에 앉지 않았다. 협상 테이블에 앉지 않으니 필요한 행위를 했다. 그뿐이다.


그린란드 협상이 사실 트럼프 2기 협상의 백미인데, 2025년의 협상에서 미국은 언제나 유리한 위치에 있었다. 미국은 협상 테이블에 상대를 초대했지만, 상대방에게 선택지를 강요하는 플레이였고, 미국은 협상 테이블이 열리든 말든 별 상관이 없었다. 관세는 그냥 매기고 진행해도 그만이었고, 베네수엘라 또한 사전 경고 없이 무력을 행사해도 됐었다. 싸우기 전에 먼저 이기고 전쟁을 시작한다, 손자병법의 주요 책략이다. 트럼프는 손자병법을 좋아한다고 했다.


그린란드 협상은 내가 이해하는 바 트럼프 2기 협상에서 가장 불리한 협상이었다. 상대방이 협상 테이블에 앉을 필요가 없었다. 멀쩡한 땅 위에 갑자기 미군기지를 대거 증강한다고? 희토류 통제권을 확보한다고? 누가 응하겠나? 덴마크는 그저 코웃음치면 그만이었다.


여기서 앵커가 등장한다. '앵커'는 협상의 기본 중의 기본이다. 처음에 내가 원하는 바를 던지고 거기서 조정해나가는 거다. 영업전략에서 앵커는 세게 던질 수도 있고 약하게 던질 수도 있다. 외교 협상에서 앵커는 일단 세게 던지는 게 기본이다. 외교에서 앵커는 나는 이 이상으로는 무엇도 바라지 않겠다는 선언이다. (이것도 변주가 있긴 한데, 약하게 던져서 협상테이블에 앉은 다음에 상대방이 서명하기 직전에 "안 할래" 하면서 판을 엎는 방법이 있다. VC의 스타트업 투자나 M&A 협상에서 종종 보인다. 국가 간 협상에서도 이런 식으로 할 수는 있다. 양아치 소리 듣겠지만.)


앵커에 대해서 일상에서 자주 접하는 일은 아마도 옛날에 용산전자상가에 전자제품 사러 갔을 때일 것이다. 용산의 형아들은 항상 "어디까지 알아보고 오셨어요?"를 묻는다. 상대가 먼저 앵커를 던지도록 해서 거기에 나의 가격을 맞춰가는 거다. 여기에 대응해서 진짜 얼마까지 알아봤는지를 던지는 게 아니라, 내가 실제 알아본 가격보다 더 낮은 가격을 던져야 한다. 그러면 노련한 형아들은 "그 가격에는 못 팔고요. 그 집 가서 사세요." 한다. 그래서 "네 알겠습니다." 하고 뒤돌아서면 "아 잠깐만" 하고 잡는 경우가 가끔 있다. 요새는 온라인 최저가로 구매하니까 이런 걸 경험할 일이 적다. (꼰대가 되었다.)


각설하고, 트럼프의 첫발은 합병이었다. 갑자기? 물론 이전에도 언론에 솔솔 보도가 되었다. 그런 다음에 일단 합병을 던지고, 합병에 반대하는 국가들에게 관세를 던졌다. 그리고 항공모함 전단을 배치하고 무력 시위를 했다.


관세? 2025년 한 해 내내 떠들썩하다가 이제 좀 소강상태에 오지 않았나. 그 악몽을 불러일으켰다. 그리고 무력시위? 바로 직전에 주권국가에서 특수작전을 실행하여 대통령의 신변을 확보하지 않았나? 그런 직후에 그린란드과 유럽 국가들에 대고 이 카드들을 다 던진 거다. 앞서의 이 뉴스들이 없었다면 관세나 무력시위가 그냥 헛소리로 들렸겠지. 그러나 그 '트럼프'니까 이게 헛소리로 들리지 않는다. 설마 설마 싶기는 해도, 진짜로 무력침공을 하려나 하는 생각이 단 1g이라도 드는 거다.


그렇게 협상테이블에 앉았고, 다보스 포럼에서 ...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

Basic 7일 무료 체험 시작하기
이미 계정이 있으신가요?로그인하기
댓글 72개
기본게시판 카테고리의 다른글

이란 전쟁 이야기 한 숟갈

줄곧 이란 전쟁 이야기를 한번 다루고 싶었지만, 에이전트랑 노느라 시간을 못 냈음. 얼마전에 맥미니도 도착해서, 오픈클로랑 이것저것 해보느라 더 정신없기도 했고. 에이전트 이야기도 할 얘기가 워낙 많기는 한데, 조만간 다루기로 하고. 오늘은 이란 이야기 서론이 길다 긴 얘기를 하려면 본인의 세계관을 먼저 서술하는 게 유용하다고 생각함. 그러나 다들 아는 이야기일 수 있어서, 지루해질 테니 넘길 사람은 그냥 넘기고 다음 파트부터 읽으면 됨. 영웅사관, 아날학파, 대층 이런 이야기 할 거임 역사관의 역사 인류가 역사를 바라보는 관점은 시대에 따라 변해왔음. 대략 세 개의 축이 있음 1) 신의 섭리 중세까지의 역사를 바라보는 대표적인 시각. 그 이전 그리스-로마 때에도 신의 이야기가 있었고, 이집트 문명 때도 마찬가지였음. 인간이 설명할 수 없는 불규칙한 변동에 대한 가장 간편한 설명, "신의 뜻이다."는 당연히 가장 먼저 나오는 세계관임 중세까지 이 세계관이 지배했었음. 역사는 정해져 있고, 인간은 그 내막을 알지 못함. 그저 신이 시키는 대로 따르는 것이 인간의 의무임. 근데 문제는 이 신이 나의 신일 뿐인 거라서, 다른 신을 믿는 자들을 어떻게 대해야 하는가에 대해서는 의견이 분분함. 애초에 신이 여럿이면 별 상관이 없는데, 유일신을 믿으면 다른 신을 섬기는 자들을 인정하는 행위 자체가 배교 행위가 됨. (흥미롭게도, 이슬람은 유일신이면서 유대교와 기독교를 인정함. 신은 하나(알라)이고 그때그때 신의 뜻을 알리는 예언자를 인간 세상에 내려보내는데, 순서대로 모세, 예수, 모하메드임. 이슬람 입장에서 유대교와 기독교는 그냥 선배들임. 근데 선배가 "나는 그런 후배 모른다" 하니까 서운함) 현대 관점에서 보자면 신의 섭리라는 세계관은 정치도구로서 작용한 면이 큰데, 신의 섭리를 믿는 자들 입장에서는 그런 해석 자체를 용납할 수 없음 사실 이 세계관은 현대에도 여전히 살아있음. 미국 입장에서 이란 공격은 미국을 위협하는 악의 세력을 격파하는 일임. 이스라엘 입장에서도 마찬가지고. 마찬가지로 이란 입장에서 미국의 공격은 이교도의 침략임. (중동 친구들의 세계관은 현대사회에 적응하기가 상당히 빡센데, 이슬람 교리가 생활의 모든 부분을 통제하고, 국가라는 개념 자체가 그들 교리에 잘 안 맞음. 중동의 각'국'은 성립부터 서방의 입김에 따른 것이었고, 세속의 국가 지도자라는 존재를 어떻게든 이슬람 교리에 끼워맞춰야 하는데, 그게 쉽지 않음) 2) 영웅주의 우리가 어린 시절 들어왔고, 지금도 자주 보이는 세계관이 영웅사관임. 시대는 몇몇 특출난 리더의 지도력으로 인해 변함. 따라서 역사를 이해하기 위해서는 영웅들이 자라온 과거, 유년시절 환경, 어떤 역경을 이겨냈고 어떤 인연을 맺었는가, 어떤 성격과 목표를 가지고 있었는가를 보아야 함 계몽주의 이래 영웅사관이 대두되었는데, 자연스러운 현상임. 신의 섭리라는 자리를 과학이 조금씩 치고 들어오면서, 인간이 신의 보호 아래 그 뜻을 따르기만 하는 존재가 아니라 스스로 두 발로 걸으면서 자기 길을 개척해나갈 수 있는 존재라는 개념이 기저에 자리함 그러면서도 신의 섭리라는 관점과 공유하는 지점이 있는데, 다수 인간의 의지보다는 그들을 이끄는 특출난 개인에 초점을 맞추면서 각 개인은 리더들의 대립에 쓸려다니고, 리더를 떠받들고 보호받는 존재가 됨 현재도 영웅사관은 자주 찾아볼 수 있음. 미국이 이란을 공격하는 것을 '미친 트럼프' 한 명의 독단으로 해석하는 것임. 이런 세계관에서는 트럼프 한 명 제거하면 세계에 평화가 찾아옴. 이스라엘은 네타냐후를 제거하면 되고, 이란은 하메네이를 제거하면 되고, 중국은 시진핑을 읍읍하면 됨. 과거로 돌아가서 히틀러를 암살하면 독일이 2차대전을 일으키지 않음. 그러나 세상이 그러한가? 3) 아날학파 뭐라고 불러야 할까, 철학에서 말하는 구조주의와는 좀 다른 느낌인데, 아무튼 전반적인 구조에 집중함. 다수 인간 무리가 처해있는 구조적인 환경 하에서, 흘러가는 어떤 줄기가 있고, 그 줄기들이 교차되면서 일이 일어난다는 것. 사건은 큰 흐름의 파편일 뿐임. 리더를 제거한다고 해서 일어날 일이 안 일어나지는 않음 2차 세계대전은 베르사유 체제의 어설픔 - 패전국을 너무 심하게 압박했고, 해야 할 조치를 명확하게 규정하지 않았고, 가장 강력한 리더쉽을 가진 자가 발을 빼버려서 강제력을 가지기 어려웠던 체제 - 에서 파생된 어쩔 수 없는 귀결 - 하이퍼인플레이션, 실업, 기존에 남아있던 높은 생산성과 제조기술 등 + 공산주의 물결에 대응하는 군국주의 - 임 인간의 선택압으로 작용하는 구조적인 요소는 복합적인데, 장기적으로 유지되는 지리, 기후, 천연자원 등, 중기적으로 변하는 인구구성, 기술발달, 주변국과의 관계 등, 단기적인 경기변동, 자연재해, 리더십 교체 등의 이벤트가 있음 아날학파에 대한 반박으로 문화나 제도와 같은 인간의 선택을 들기도 하는데, 그 또한 큰 범주에서는 구조의 한 축이라, 학술 분파 간의 싸움이라고 볼 수 있음 이 외에도, 어차피 이런 분석이 다 무의미하고, 모든 건 다 우발적인 일들의 연속이라는 주장도 있는데, 이를테면 프란츠 공 암살 사건이라든가, 나가사키 원폭이라든가('고쿠라의 행운'을 검색해보시길).. 근데 이런 건 원래 모든 단일 사건에는 다양한 우발적인 사건들이 겹쳐있는 건데, 그걸 가지고 전체 구조의 힘을 부정하기는 무리이므로 패스 (이쪽은 과거로 돌아가서 히틀러를 암살할 필요도 없다는 쪽. 만 명의 히틀러가 태어나서 나치의 리더가 되는 경우는 우리 세계의 히틀러 한 명뿐이라는 사고. 그럴 수도 있지만 이 세계관을 받아들이면 인간이 할 수 있는 게 없음) 종합 내가 바라보는 세계관은 기본적으로 아날학파의 관점임. (원래 그런 단어도 모르고 살아왔는데, 분류표를 보니까 그쪽이었음.) 그렇다고 영웅사관을 아주 부정하지는 않음. 기본적으로 국가의 선택에는 선택권자들에게 부과되는 여러 선택압이 있고, 선택압이 허용하는 여러 범주 하에서 각 지도자가 각자의 취향에 맞는 선택을 한다, 라고 정리할 수 있겠음 이쪽을 정교하게 설명하는 책으로 그레이엄 앨리슨의 '결정의 본질'이라는 책이 있음. 매우 재미없지만 매우 유익한 책임. '투키디데스의 함정'으로도 더 잘 알려진 분인데, 그 책보다는 이 책이 훨씬 유익함 투자를 할 때에는 기본적으로 바텀업을 중시하지만, 국제정세를 볼 때에는 탑다운 관점을 취함. 애초에 국제정세라는 게 매크로에 해당하는 영역이기도 하고, 국제정세에서는 수많은 가설이 난립하고, 그 대부분의 가설은 그 가설 자체의 신빙성 보다는 본인의 세계관(선악구조)를 강화하느라 끼워맞춘 가설이 많아서 신뢰하기 어려움. 그러므로 국제정세를 볼 때에는 여러 줄기 중에서 가장 강력하게 영향을 미치는 줄기들을 잡고, 거기서 그때그때 필요한 여러 갈래들을 통합해나가는 게 현실적이면서 유용한 관점을 얻을 수 있음 그런 측면에서 미국을 바라볼 때 시드가 되는 줄기는 두 가지임. 하나는 '바텀업', 하나는 힘.' 이야기가 나온 김에 다른 지역들이 시드를 언급해보자면, 중국을 볼 때에는 '대국', '공산당'이고, 중동을 볼 때에는 '이슬람', '이스라엘'임. 유럽은 '은퇴', '분열'. 한국은? '주변국', '인구밀도', '교육열' 정도? 미국은 이란을 왜 공격하였나 이제 본론을 시작함. 주변에 이야기를 나누다 보면 애초에 미국이 이란을 왜 공격했는지조차 모르는 분들이 많았음. 아니 뭐 나라고 뭘 '아는' 건 아니지만, 너무나 어이없고, 예측불가능했고, 부도덕하고, 명분 없고, 몰상식하다는 시각이 많아서 놀랐음. 뭐 미국이 잘했다는 건 아니지만, 이미 베네수엘라 작전때부터 미국은 군사행동 옵션을 우선순위 상단으로 옮겨놓았고, 이란 시위때부터 군사개입을 언급해왔었음 전쟁은 이미 진행 중이었음 국제정세에 어지간히 관심이 없는 사람이 아니라면, 작년에 중동이 시끌시끌했다는 건 알고 있을 거임. 서로간에 본격적인 미사일 공세가 있었고, 삐삐에 폭탄을 심어서 한 번에 요인을 암살했다거나 하는 뉴스도 봤을 거임. 작년에는 아예 이스라엘과 미국이 합동으로 이란을 공격하기도 했었음. 타임라인을 대략 살펴보면 다음과 같음 고마워 클로드. (퍼플렉시티로 교차검증함. 대략 맞다고 함) 주로 이스라엘이 주도하긴 했지만, 미국도 상당한 수준으로 개입해왔고, 여기에 사우디, 중국도 개입되어있음. 생각보다 복잡하고 위험하고 중대한 사안들이 벌어지고 있었음 공식 명분 우선 미국이 이야기하는 공식 목표는 크게 네 갈래 (사람마다 발언이 조금씩 다르긴 함) 핵 위협 제거 - 트럼프의 주된 프레임. 이란이 핵무기를 가지게 할 수 없다. 선제적 자위 - 국무장관 마르코 루비오의 발언. 이스라엘이 이란을 선제공격할 것이고, 이는 이란의 대 미국 공격을 촉발할 것이기 때문에, 선제적으로 제거하기로 했다. 재래식 군사 위협 - 국방장관 피트 해그세스의 발언. 탄도미사일, 드론 무기고 등이 핵무장을 위한 방패가 되고 있었음 인도주의적 명분 - 1월 이란 시위 때 트럼프는 발언 수위를 높여왔고, 전쟁 이후에도 "너희의 정부를 가져라"라고 레짐 체인지를 암시 이게 만족스럽지 않은 사람은 다른 여러 가설을 갖다붙이는데, 사실 나도 만족스럽지 않기는 마찬가지임. 2번 선제적 자위는 국제법상의 전쟁명분을 만족시키기 위한 것 같으니 제거, 3번 재래식 군사 위협은 1번에 종속되니까 제거, 4번 인도주의적 명분은 굳이? 특히나 미국은 타국의 레짐 체인지에 개입했다가 크게 쓴맛을 본 경험들이 있기 때문에 저게 주 이유가 될 수는 없음. 저게 이유라면 유엔을 소집했어야지. 그러나 1번 하나만으로도 충분한 이유는 된다고 봄. 이란의 핵무장은 이란 하나만의 문제가 아님. (물론 이란 자체만으로도 큰 문제임.) (미국보다는 이스라엘에 더 큰 문제.) 그간 핵무장을 포기한 나라들이 어떤 처참한 말로를 맞이했는지 독재자들은 다 알고 있음. 그리고 어떻게든 핵을 갖춘 나라들이 어떻게 살아남았는지도 알고 있음. 그러니 독재자 입장에서 핵무장은 반드시 가져야 하는 카드이고, 이걸 포기했을 때 미국으로부터의 확실한 안전보장을 획득해야 함. 미국과 친하게 지내거나, 죽거나 둘 중 하나임. 근데 미국은 친하게 지내다가도 언제 등 돌릴지 모름 핵무장을 원하는 모든 나라들의 이목이 이란에 쏠려있기 때문에, 이란이 핵무장에 성공하는 이는 다른 나라들의 연쇄 핵무기 확보로 이어짐 맨처음으로 돌아가서, 미국의 행동을 설명하는 시드는 두 가지, 바텀업과 힘이라고 했음. 여기서 힘이라 함은, 1등 국가로서의 지위를 이야기함. 미국이 1등 국가인 이유는 군사력이고, 군사력에서 현재의 달러 기축통화 체제, 경량기업들의 고수익성 체제가 유지됨. 군사력으로 세계의 교역로를 유지하고 달러를 사용한 금융시스템이 편리하기에 다른 국가들은 그 체제를 사용하는 것임. (달러가 기축통화이기 때문에 미국이 힘을 누린다는 '달러 패권' 이론이라든가, 석유를 달러로 결제하면서 기축통화 체제를 유지한다는 '페트로달러' 이론은 개인적으로 매우 싫어함. 기축통화여서 힘을 누리는 게 아니라 힘이 있어서 기축통화가 되는 것임. 그리고 석유 달러 결제는 이미 깨졌음. 근데도 달러는 멀쩡하잖아.) 미국이 미국이기 위해서는 가장 강력한 국가여야 함. 이미 재래식 군사력으로는 미국을 이길 자가 없으나, 핵전력은 이야기가 좀 달라짐. 국가 간 협상의 대원칙은 국가의 의도보다는 국가의 역량이 우선순위임. 무엇을 하고자 하느냐보다는 무엇을 할 수 있느냐가 훨씬 중요하다는 뜻. ('크로 메모랜덤' 검색해보시기 바람.) 북한이 현재 생존해있을 수 있을 수 있는 가장 강력한 이유는 핵무기임. 핵이 없었더라도 중국 입장에서 완충지대로 남겨둘 이유는 충분하지만, 핵이 없는 북한의 지위는 아프간이나 파키스탄 정도일 것임 그래서 핵 위협 제거만으로도 전쟁을 일으킬 이유는 충분하다고 생각함. 문제는 핵 위협이 대중 레벨에서는 검증되지 않았다는 것. 실제로 이란의 핵 개발 프로그램이 '곧' 완성될 예정이었는가 하면 그건 우리는 모름. 우리가 알 수 있는 건 이스라엘이 강력하게 위협을 느꼈고, 미국이 이에 동조하고 있다는 것뿐임 비공식이지만 설명 가능한 명분 그리고 또 한 가지. 미국의 대전략의 시드는 바텀업과 힘인데, 미국의 중동 전략을 바라볼 때 시드는 하나가 추가됨. 셰일 오일임. 미국은 2010년대 초반 셰일가스/셰일오일이 대중화되었고, 2010년대 후반이 되면 석유 순수출국이 됨. 미국은 태생부터 안보를 지극히 걱정하는 나라였음. 애초에 미국이 'United' States가 될 수 있었던 것도 구대륙으로부터의 침공에 맞서기에 연방이 되는 게 유리했기 때문이 컸음. ('페더럴리스트' 참고.) 1차대전 이후 오일이 주요 에너지원이 되면서 미국의 대전략에서 중동의 중요도가 올라감. 그전까지는 중동은 그냥 사막에서 낙타 타고 교역하는 친구들이었고, 오스만 제국 휘하의 불모지였음. 1차대전 끝나고 땅따먹기 하던 중에 석유가 발견됨. 1900년대 초중반 중동은 오스만 제국 멸망 이후의 무주공산, 새로운 식민, 산유지 같은 느낌. 힘없는 빈땅인데 석유가 나네? 히힛 내꺼! 하는 곳 중동 친구들은 당연히 못마땅했고(못마땅한 사유는 이거 말고도 많음), 이슬람 왕국을...
기본게시판
2026. 03. 22
439
49
11,005
이란 전쟁 이야기 한 숟갈

AI 에이전트 단상들

그동안 뭘 했냐면 클로드로 뭔가를 만들어본 지 5일차, 연휴를 맞이해 싱가폴 여행을 다녀옴 (출국 직전에 카카오 챗GPT 프로를 액티베이트해놓음. 비행기 기내 wifi로 딥리서치를 돌려보는데 아뿔사, 디바이스를 계속 켜놔야 함. 원격 PC를 쓸 수도 있지만 공용 wifi로 접속하긴 좀 그래서 싱 도착해서 해봄. 카카오 프로모션 4개 마저 구매하려는데 품절됨. 흑흑 ㅠ) 귀국하자마자 클로드 코드로 작업 시작. 의도했던 게 순식간에 만들어짐. 깃 커밋도 다 해줌. 전주에 챗봇이랑 대화하며 복붙하던 것도 신세계였는데, 또 새로운 세계가 펼쳐짐 개인 루틴 자동화는 이미 거의 완성되어서, 이제는 팀 단위로 활용할 수 있는 대시보드를 만들어봄. 이것도 원래는, 엑셀로 데일리 수작업하던 걸 자동화하려다가, 아 이거 그냥 아예 서비스를 만들어도 되겠다 싶어서 해봄. 순식간에 프로토타입이 나와버림. (정확히는, 여의도에서 강남역 가면서, "나 퇴근해야 하니까 알아서 네가 쭉 작업해줘." 한 마디 던져놓고, 가끔 원격 들어가서 엔터만 툭툭 쳐줬는데, 택시 내릴 때쯤에 프로토타입이 나왔음...) 그리고 수목금 3일간 작업한 결과, 실제로 내가 유용하게 쓸 수 있을 만큼의 결과물이 나옴 퇴근시간이 빨라졌는가 전혀 빨라지지 않았음. 매일매일 업무량은 많음 다만 차이가 있다면, 일의 밀도가 달라짐. 원래부터 밀도있게 일한다고 자부했으나, 3주 전의 나는 그냥 굼벵이였음. 이번주의 나는 여행 직후의 밀린 일, 이번주 해야 할 일, 대시보드 개발을 동시에 진행함. 그러면서 인뎁스 리포트도 몇개 읽음. (사람도 많이 만남. 이번주 저녁약속만 4개에 점심미팅과 티타임 미팅도 있었음) 데일리 루틴이 이미 자동화되어 있었기 때문에 사실상 쌓인 일이랄 것 자체가 거의 없었고, 대시보드 개발은 가끔 진도 확인하면서 요구사항만 이야기하면 되었기 때문에 가능 업무자동화를 많이 하면 업무량이 줄어들 거라는 생각은 매우 착각. 그동안 하고 싶지만 시간이 없어서 미뤄둔 수많은 일들을 할 수 있게 됨. 업무량은 줄지 않았지만 업무의 밀도가 높아지고, 즐겁고 신나게 일함. 자동화를 하고 나서 업무시간이 줄어드는 사람은 '하고 싶지만 시간이 없어서 미뤄둔 일'이 없다는 뜻일 수 있고, 그렇다면 AI로 인해서 자리를 잃게 될 1순위 직군일 수 있음 개발 경험이 있으면 유리하다 뭐 너무 당연한 소리지만, 에이전트는 진입장벽을 낮추었을 뿐, 개발자보다 더 잘하게 만들어주지는 않음. 애초에 출발선에 설 수도 없는 사람을 출발선에까지 데려다주기는 한다 정도의 느낌? 훈련된 선수들보다 더 빠르게 달릴 수는 없음. 개발자들이 에이전트로 인하여 느끼는 당혹감과는 별도로, 개발자와 비개발자의 갭은 명백히 존재함 아주 단순한 예를 들자면, 제미나이 API를 활용한 뭔가를 만들어달라고 하면, 얘네가 옛날에 학습한 모델이라 그런지 gemini-flash-2.0을 연결함. 근데 2.0은 지금 서비스하지 않음. 오류메세지를 복붙하면 아 그렇구나 하면서 gemini-flash-2.5를 맞춰줌. 다른 프로젝트에서도 같은 일이 계속 반복됨. 그 삽질을 안 하려면 gemini-flash-latest를 사용하라고 하면 됨. 자동으로 최신버전을 호출함 개발 경험이 있는 사람이라면 무슨 숨 쉬는 법도 알려줘야 하냐라며 어이없어하겠지만, 개발자와 비개발자의 갭은 그런 거임. 누구는 파이썬 설치에만 두 시간이 걸림 (3년 전에 내가 그랬음) 코딩 에이전트로 뭘 어디까지 시킬 수 있을지도 개발을 해본 적이 있어야 감이 옴. 컨텍스트 윈도우 개념을 알아야 작업을 어떻게 얼마나 쪼개서 지시해야 할지 알 수 있음. 외부 API를 사용할 때에도 그 API가 어떤 기능들을 가지고 있는지 알아야 작업이 수월해짐 인공지능은 분명 인간 간의 역량 차이를 줄이긴 했음. 누구나 출발선에 설 수는 있음. 그러나 요이땅 하고나서의 생산성은 여전히 격차가 큼. 개발자는 1년 걸릴 일을 일주일만에 할 수 있게 되었고, 비개발자는 평생 꿈만 꿔오던 일을 시작할 수 있게 되었음. 그러나 그 두 사람에게 일주일의 시간이 주어졌을 때 내놓을 산출물의 퀄리티는 전혀 다름 그리고 누군가는 출발선에 서는 일 자체를 싫어함 호기심과 실행력 연휴 전 호기롭게 벌려놓은 토론창에 감사하게도 많은 분들이 귀중한 이야기를 나누어주심. 그중 계속 곱씹게 되는 키워드가 있었는데, 바로 '호기심과 실행력' 아무리 좋은 게 있다 해도 안 쓰는 사람은 안 씀. 요며칠 사람을 만날 때마다 내가 AI로 뭘 만들었는지 썰을 풀고 다녔는데 흥미로워하는 사람들이 다수였지만, 끝끝내 "나는 안 할 거다", "나는 못한다", "나는 필요가 없다"라는 반응도 있었음 나는 필요가 없다? 나도 그랬음. 한 달 전까지만 해도 클로드가 코드를 잘 짜준다고 하는데, 나도 해볼까? 근데 나는 코드 짜서 하고 싶은 일이 없는데? 했었음. 지금은 하고 싶은 게 너어어어무 많음 나는 못한다? 나야 뭐 20년 전에 깨작거려본 경험이 있어서 그나마 남들보다는 진입장벽이 낮긴 했지만. 주변에 비개발자, 코드라고는 난생 한 번도 잡아보지 못한, 윈도우 커맨드창 한 번 열어본적 없는 사람들이 무언가 뚝딱뚝딱 만들어서 쓰기 시작함 나는 안 할 거다? 뭐 이거야 개인 취향인데. 이미 다 가진 사람들이라면야 알아서 행복하게 사시겠지만, 아니라면, 음... 이전 글에서도 이야기했지만 기계가 당신을 대체하느냐 아니냐는 지금 시급한 이야기가 아니다. 당장 일어나고 있는 싸움은 기계를 잘 쓰는 사람과 기계를 못 쓰는 사람의 경쟁이다. 오늘도 당신 옆자리의 누군가는 생산성을 높이며 당신의 책상 다리를 자르고 있다. 필요한 건 딱 두 가지다. 호기심과 실행력. "이게 뭐지?" 하는 궁금증과, "안녕 클로드"를...

클로드는 신이다 ㅇㅇ

연휴 때 놀러 가기 전에 뭐라도 적어놓고 싶어서 막 적어봄 2026-02-10 00:46 편의상 월요일 밤이라고 하겠음 일을 마치고 누웠는데, 무슨 바람인지 자다가 새벽에 벌떡 일어남 지난 한 주 동안 무슨 오픈클로니 클로드 코워크니 하도 말이 많고 SaaS 기업들 주가가 폭락하고 그랬는데 아무 감이 없어서, 막연한 불안감이 있었나 봄 지금 뭐라도 하지 않으면 진짜 뒤쳐지겠다 싶었던 거 같음 지금에서야 그랬나보다 싶지, 그땐 그냥 별 생각이 없었고 인공지능이 코드도 다 짜준다는데. 나도 자동화 한번 해볼까? 정도의 마음이었던 거 같음 코딩은 클로드가 잘한다던데. 클로드한테 코드 짜달라고 해야겠다. 클로드는 쿼리에 타임스탬프를 찍어준다. 와아아 대충 대화를 나누고, 뭔가 자동화해볼까 하다가, 딱 떠오른 게 텔레그램 메시지들.. 아침에 눈 뜨면 수백 ~ 수천 개의 메시지가 쌓여있는데. 하나씩 클릭해서 스크롤함. 뭐, 옛날 선생님들 조간신문 읽는 느낌으로 하는 거긴 한데, 업계에 들어온 지 대략 20년쯤 되었는데, 옛날에는 야후 메신저라는 게 있었고, 그 전에는 MSN 메신저라는 것도 썼었고, 나란 녀석 뭐 하나 흘려보내지 못하는 성격이라, 그당시엔 일일이 모든 메시지를 저장해놨었음. 너무 비효율적이라 다 갖다버리기는 했는데. (아니 지금 하드 한 구석 어딘가에 잠들어 있다.) 암튼 그런 성격이다 보니 텔레그램 메시지도 흘려보내지 못하고 unread count 0이 될 때까지 다 읽음. 두 시간쯤 걸림. 중간에 일정이 있거나 하면 오후 세네 시가 되어서야 메시지 체크를 끝냄. 석간신문 나올 때가 되어서야 조간신문 마무리하는 격 다 읽자니 괴롭고, 안 읽자니 감 떨어지는 게 두렵고. 막상 읽으면서 중요하다 생각해서 따로 저장해두는 메시지는 20~30개 수준. 이걸 누군가 읽고 요약해주면 좋겠는데. 어차피 뎁스 있는 분석이나 고민은 보고서 읽거나 미팅하면서 할 거니까. 책도 읽고. 그렇게 코딩(?)이라고 부를 수도 없는 코딩 시작 두 시간 후 결과물 예..? 아니 ㅋㅋㅋㅋ 나때는 ㅋㅋㅋㅋ 헬로 월드 한 번 보려면 public static void main() 아니 그게 뭐냐고 ㅋㅋㅋ 아 몰라 설명하면 두 시간 걸리니까 일단 따라서 쳐 막 이랬는데 (실제로 교수님의 첫 멘트였음...) 구문 오류 하나 뜨면 그거 잡느라 하세월. 하나 잡고 만세 외치면 다른 오류 세 개가 뜨고. 다 잡았다고 만세 하면 아까 잡았던 오류가 또 뜨고. 그거 잡고 나면 갑자기 새로운 오류가 이백 개.. 툭하면 버퍼 오버플로우 스택 오버플로우.. 선배 형들은 야 니네는 가비지 컬렉션 있어서 편한 줄 알아 이러시고 으앙 야 그래도 하드웨어쪽 가면 C랑 어셈블리 해야 해 으앙 아 온갖 생각이 떠올랐는데. 암튼 세상 정말 좋아짐 2026-02-10 아침 내가 어젯밤에 무슨 짓을 한 거지 오 나도 드디어 개발자..? 는 아니지만 암튼 무언가 만들어냈다 오오 이것이 생산적인 일의 기쁨!! 내가 한 일이란 비록 클로드님께서 점지해주시는 코드를 복문했을 뿐이긴 한데. 그래도 매우 뿌듯함. 으하하. 그럼 이제 개량을 해봐야지!! html로 받아서 브라우저에 띄우는 건 너무 구식이잖아. 2002년 네이버 지식인 시절의 인터페이스임. 나모 웹에디터로 홈페이지 만들던 시절 ㅇㅇ 어차피 텔레그램에서 긁어온 원문, 텔레그램으로 돌려주마 짜잔 여기까지 또 두 시간쯤 걸림 20년 만에 코딩하는 사람이 (아니 그건 코딩이 아니라니깐) 파이썬 깔고 API 받고 등등 삽질하는 시간 다 합쳐서 네 시간 걸려서 수백 개 메시지를 읽고 요약, 주제별 분류, 중요도 표기, 감정적인 반응 기록, 출처 링크 클릭하면 원본 메시지로 바로 이동하는 자동화를 구현 매일 원하는 시간에 정기적으로 자동 실행 가능하고, 필요할 때마다 실행 가능. 내가 자고 있어도 가능. 해외에 있어도 가능. 으앙? 이렇게 하루 두 시간의 루틴업무가 사라졌읍니다. 물론 그게 말처럼 쉽진 않았다. 각종 버그. 서식. AI 모델의 토큰 제한으로 이것저것 교체해가면서 쓰고 (제미나이 무료 모델은 일 20회 제한!) 기껏 ...
기본게시판
2026. 02. 13
241

내일(1/28) 번개..!

안녕하세요 호옹입니다. 제가 지난번에 번개를 쳤는데, 따로 연락드릴 방법이 없어서 여기에 공지 올립니다. 1/28(수) 19:00 역삼역 근처 스타벅스 센터필드R점에서 뵙겠습니다. 저녁식사는 각자 하시고, 모여서 티타임과 담소를 나누는 것으로 하겠습니당. 참석자는 Classic Tree, 에리시온, 데드캣, 안스, 진인사대천명, Cacacy 님 입니당. 그리고 제가 친애하는, 밸리AI의 연예인 ILGO님도 특별 초빙했습니다 ㅎㅎㅎㅎ 당일의 참석 관련 연락은 이 글에 댓글로 달아주시면 되겠습니다. 내일 뵈어요!!
기본게시판
2026. 01. 27
105
36
1,280

KV Cache 문제와 해법, 낸드 수급

좋았어 두 번째 글 뉴스 2026년 1월 5일, 젠슨황 선생님께서 CES에서 발표를 하심 할 얘기가 참 많았는데 공부할 것도 많아서 뒤늦게 하나씩 썰을 풀어보고자 함 우선 KV 캐시 KV 캐시에서 병목이 생기고 있고, 에이전트로 가면서 병목이 더 심해지고, 차세대 베라 루빈 시스템에서는 이걸 따로 관리하기 위해서 별도의 메모리 구조를 갖추고 그걸 운영하는 칩셋도 따로 만들었다고 함. 그걸 구동하려면 낸드 사용량이 폭발한다고 함 한국인 투자자로서 메모리 수요 늘어나면 좋기는 한데, 왜 늘어나는지 얼마나 늘어나는지 언제까지 늘어나는지 감을 좀 잡아야겠음 나름대로 트랜스포머 구조에 대해서 공부했다고 생각했는데, 매우 얄팍했다는 걸 깨닫고, 좀 더 공부함 주안점 KV Cache가 뭔데? 왜 문제가 되는데? 솔루션은? 낸드가 공급부족이 된다고? 진심? KV Cache가 뭐냐면 트랜스포머부터 트랜스포머 구조가 뭔지부터 설명을 해야겠는데. 트랜스포머 구조를 아는 사람이면 그냥 넘어가도 됨. 사실 트랜스포머 구조를 잘 아는 사람이면(KV Cache가 뭔지 아는 사람이면) 이 글 자체를 안 읽으셔도 됨. 대단한 인사이트가 아니라 그냥 공부한 거 정리한 포스팅임 트랜스포머를 이해하려면 우선 언어 번역 알고리즘을 만드는 시절로 거슬러 올라가야 함. 규칙 기반이니 뭐니 하는 이야기는 집어치우고, 구글 이야기부터. 구글은 언어는 확률이다, 통계적 분포로 언어를 이해할 수 있다는 큰 가설을 가지고 이런저런 시도를 하고 있었음. (구글이 최초는 아님) 우리가 사용하는 언어는 상당히 많은 생략된 정보를 담고 있음. 'Apple'이라고 하면 사과인지 아이폰 만드는 회사인지 모름. '사과'라고 하면 apple인지 apology인지 모름. 문장 중에 it이 나오면 그게 뭘 지칭하는지 모름. 인간은 대화의 전반적인 맥락에서 해당 단어가 구체적으로 뭘 의미하는지 대충 알아들음. (말그대로 대충 알아듣는 거라서, 인간과 인간 간의 대화도 삑사리가 많이 남) 언어를 다루려면 우선 문장을 토큰화해야 함. 의미가 뭔지를 이해하기 전에, 의미를 가진 단위들로 일단 문장을 쪼개야 그 의미를 알든가 말든가 할 거 아님? 언어에서 의미를 가진 최소단위를 토큰이라고 함. (정확히는, 모델이 언어를 이해하기 위한 최소단위라서, 형태소보다 더 잘게 쪼개기도 함.) 예를 들어, 방금 앞 문장에서는 "언어/에서/의미/를/가지/ㄴ/최소/단위/를/토큰/이라고/하/ㅁ" 이런 식으로 문장을 분해할 수 있음. 이렇게 분해된 각각이 토큰임. 언어별로, 모델별로 토큰을 쪼개는 방식이 다양하긴 한데, 그건 넘어가자. 언어모델이 언어를 학습한다는 건 여러 과정이 있는데, 그중 하나가 임베딩임. 임베딩은 토큰을 N차원 공간에 배치하는, 즉 언어의 지도를 그리는 작업임. 토큰을 임베딩하고 나면 신기한 현상을 발견할 수 있는데. 언어에서도 연산이 가능하다는 거. '서울'이 배치된 위치에서 '- 한국 + 프랑스'를 연산하면 '파리'가 나옴. (서울이 위치한 벡터(행렬)에서 한국의 벡터만큼 마이너스 덧셈을 하고 프랑스의 벡터만큼 더하면 파리가 나온다는 뜻. 행렬연산은 다들 할 줄 알잖음?) 참고로 말이 N차원이지, 지금의 언어모델에서 N의 값은 수천~수만에 달함. 이 각각의 차원이 뭐냐면, 아마도 먹는 거, 입는 거, 인간관계, 물리적인 실체, 감정, 뭐 이런 다양한 범주들일 건데, 그게 뭔지는 사실 모름. 인간은 이해할 수 없음. 그냥 학습시켜놓고 나면 고양이와 강아지는 가깝고, 공룡과는 멀고, 공룡은 고대와 가깝고 인간은 현재와 가깝고, 뭐 그렇게 배치가 되는 거임. 뭘 기준으로 이렇게 배치했는지는 모름. (이걸 알아내려고 하는 별도의 연구분야도 있기는 함) 암튼 이렇게 언어를 쭉 배치해놓고 나면, 영어에서의 언어 배치와 한국어에서의 언어 배치가 상당한 유사성을 띌 거 아님? 물론 차이가 있겠지만 그 차이도 확률적으로 유의한 어떤 연산이 존재할 가능성이 높음. 우리는 영어 텍스트를 학습시켜서 영어가 임베딩된 지도를 가지고 있고, 한국어 텍스트를 학습시켜서 한국어가 임베딩된 지도를 가지고 있음. 그러면 영어에서 'apple'이라는 인풋이 들어왔을 때, 한국어 지도에서 이 토큰이랑 가장 유사한 위치에 있는 토큰이 뭐야?를 찾아보면 신기하게도 거기에 '사과'가 있다는 거임 근데 아까 말한 것처럼 apple이 사과인지 애플사인지는 맥락에 따라 정해지니까. 그걸 알아야 번역을 할 수 있을 거 아님? 그래서 등장한 게 '컨텍스트 벡터'임. 쿼리 문장을 쭉 읽은 다음에, 모델에 넘기기 전에, 우선 이 문장 자체가 뭐에 대한 이야기를 하는지를 정함. 휴대폰 사용에 관한 이야기를 하고 있었다면 apple은 아이폰 만드는 애플일 가능성이 높고, 농장에서 일하는 중이라면 apple은 사과일 가능성이 높겠지. 그렇게 컨텍스트 벡터랑 합쳐서 쿼리를 모델에 집어넣으면, apple이 실제 의미하는 그 위치로 뿅 하고 가게 된다는 거임. (정확히는 value라는 어떤 값을 생성하는 거) 이걸 가지고 번역모델을 만든 게 RNN(Recurrent Neural Network)임. 번역이 꽤 잘됨. 신남 근데 문장이 길어지면 성능이 떨어짐. 왜? 맥락이라는 게 시간이 갈수록 변하잖아. 우리가 대화를 할 때에도 주제가 계속 바뀌잖음. 영화에서도 장면이 계속 바뀌고. (장르가 바뀌기도 하고 ㅋㅋ) 이런 컨텍스트 드리프트의 문제도 있고, 컨텍스트 벡터는 한번 뽑으려면 인풋 토큰 전체를 연산해야 함. 문장이 길어질수록 부하가 많이 생김. (사실 이 문제는 트랜스포머에서도 상당히 남아있음) 그래서 여기에 더해서, 하나의 문장(혹은 여러 개의 문장들) 안에서 각 토큰이 다른 토큰과 가지는 상대적인 관계를 측정해보면, 토큰의 의미를 좀 더 정확하게 알 수 있지 않을까? 라는 가설을 가지고 시도한 게 '셀프 어텐션'임 "나는 고양이를 좋아해"라는 문장이 있으면, "나/는/고양이/를/좋아/해"로 토큰을 쪼개고, "나"라는 토큰이 다른 각 토큰과 얼마나 거리가 떨어져 있는지, "는"이라는 토큰이 다른 모든 토큰과 얼마나 떨어져 있는지 등을 모든 토큰에 대해서 계산하는 거임. 그럼 여기서 "는"은 "나"와 가깝고 다른 토큰과는 떨어져있음. "를"은 "고양이"와 가까우면서 "나", "좋아"와도 꽤 가까움 이걸 어디다 쓰냐고? 다음 문장을 보자. "The animal didn't cross the street because it was too tired." 여기서 it이 지칭하는 바는? animal임. 셀프 어텐션 함수에 넣으면 it과 animal이 가깝다는 결과가 도출됨. tired가 animal과 가깝기 때문. 그 결과를 통해 모델은 it이 animal을 지칭한다고 알게 됨. 만약 마지막 'tired'를 'wide'로 바꾼다면? "The animal didn't cross the street because it was too wide." 여기서 it은 street과 가깝다는 결과가 나옴. it과 가까운 wide가 animal보다는 street과 가깝기 때문. 이렇게 컨텍스트 벡터에 더해서 셀프 어텐션을 넣으니까 문장이 길어져도 번역이 꽤 잘됨. 매우 신이 남. 근데 컨텍스트 벡터 계산도 힘든데 셀프 어텐션까지 계산하려니 연산량이 어마어마함. (한 토큰이 가지는 value 하나를 뽑는 데 수천 행을 가진 행렬곱이 들어감) 여기서 신박한 아이디어가 떠오름. 컨텍스트 벡터가 없어도 되지 않을까? 셀프 어텐션을 넣으니까 성능이 너무 좋아져서, 야 이거 사실 컨텍스트 벡터는 필요없는 거 아닐까 해서 컨텍스트 벡터를 빼봤어. 근데 와, 성능이 너무 잘 나오는 거임. 속도도 빨라지고. 그래서 나온 논문이 기념비적인 "Attention is All You Need"임. 대 트랜스포머의 시대를 연 논문임. 이 논문 발표 이후 컨텍스트 벡터를 사용하던 RNN 아키텍쳐에서 에서 어텐션만 사용하는 트랜스포머 아키텍쳐로 대세가 급격히 변함 그리고 번역을 잘하는 언어모델을 가지고 있으면, 이걸 그대로 활용해서 챗봇도 만들 수 있음. 영-한 번역용 언어모델이 영어를 인풋으로, 한국어를 아웃풋으로 해서 두 언어 지도에서 유사한 위치를 찾아내는 과정이라면, 인풋인 영어 지도를 그대로 두고, 아웃풋을 '한국어 지도'에서 '영어 텍스트에서 하나의 토큰에 이어지는 다음 토큰'으로 바꾸면 그대로 챗봇이 됨. 이게 언어의 범용성임 현시대의 생성형 AI는 대부분 트랜스포머 기반임. 챗봇은 물론이고, 그림이든 동영상이든 자율주행이든 기본적으로 트랜스포머 아키텍쳐를 사용함. 이제 여러분은 어디서 누가 인공지능이 어쩌고 LLM이 어쩌고 할 때 "트랜스포머 아키텍쳐 기반 LLM에서는..."이라고 하면서 약간 아는척할 수 있게 되었음 KV는 Key, Value 이 셀프 어텐션이라는 녀석이 '관계 계산'을 한다는 게 핵심인데, 그걸 어떻게 하는지를 좀 자세히 살펴보자. (여기서부터가 어제오늘 공부한 내용임.) 우선 어텐션 함수는 다음과 같음 여기서 Q는 Query, K는 Key, V는 Value, T는 Transpose(행렬연산을 하기 위해서 변환), dk는 디멘션의 크기임. 공식이 나오니까 머리가 어질어질한데, 잠깐 눈좀 깜빡거리고 바깥풍경 좀 본 다음에 계속 진행하자. 눈은 소중하니까. 이제 알아야 할 개념이 Query(Q), Key(K), ...
기본게시판
2026. 02. 28
269
37
2,824
AI 에이전트 단상들
29
2,304
클로드는 신이다 ㅇㅇ
기본게시판
2026. 01. 21
228
50
2,383
KV Cache 문제와 해법, 낸드 수급
avatar
우고
2026.04.01

이 글을 읽는 건 자기 전 최고의 선택!

avatar
KIKOHO
2026.04.01

자기 직전 생각할거리+100

avatar
GTO Investor
2026.04.01

감사합니다!!

avatar
유포수
2026.04.01

크어어 ... 많이 배웠습니다

avatar
DAEUL
2026.04.01

정말 속시원한 글입니다

avatar
라이프러너
2026.04.01

시간 가는줄 모르고 읽었습니다..

덕분에 사고가 확장되었습니다 감사합니다

avatar
최프로
2026.04.01

와우.. 시각을 넓혀주는 좋은 글! 감사합니다

avatar
bananachachacha
2026.04.01

정답이 있다고 생각하는 태도가 시야를 좁게 만드는 것 같습니다. 거기다가 성질이 급하면 바로 정답 / 결론으로 가고 싶어 하는 태도가 국제 정세를 읽는데 방해가 될 듯 합니다. 수능을 안보거나 잘 못 본 사람이 유리할 수 있지 않을까도 싶네요 ㅎㅎ

avatar
canal
2026.04.01

속이 다 시원하네요..

avatar
being me
2026.04.01

감사합니다 !!!