프리미엄
예측대회
투자분석
아카데미
커뮤니티
로그인Valley AI 시작하기시작하기
Valley Space인기
퀄리티(Quality) Only 투자 - 존 로탄티
It remains Day 1독서

퀄리티(Quality) Only 투자 - 존 로탄티

avatar
호랭교관
2026.05.22조회수 51회

📌 팟캐스트 요약

존 로탄티(John Rotanti)는 베이스천 피듀시어리(Bastion Fiduciary)의 포트폴리오 매니저로, Talking Billions 팟캐스트에 출연해 자신이 1월에 론칭한 산업·인프라 전략의 운용 철학을 공개했다.


그는 "타협 없는 품질(uncompromising quality)"을 북극성으로 삼고, 추적 종목을 300개에서 60개로 줄인 '주식 유니버스'를 통해 소음을 제거했다. 또한 벤치마크와 비교하지 않고, 매도 시점에도 클라이언트에게 일부러 연락하지 않는 등 "세대를 잇는 시계(generational time frame)"라는 약속을 행동으로 지킨다.


핵심 사례로는 ▲32종목으로 출범한 포트폴리오를 25종목으로 축소해 가는 과정 ▲빌 밀러(Bill Miller)의 "낮은 평균 매입단가가 이긴다" 철학 ▲스트레스로 단련된 기업의 '생존 유전자'를 찾는 분석 프레임워크가 등장한다.

🎙️ 오늘의 게스트가 중요한 이유

  • 존 로탄티(John Rotanti) — 베이스천 피듀시어리의 산업·인프라 전략 단독 포트폴리오 매니저이자 JRo's Notes 뉴스레터 저자

  • 모틀리풀(Motley Fool)에서 약 9년간 시니어 애널리스트·포트폴리오 리드·투자자 교육 책임자를 역임

  • 본인이 진행했던 JRo Show 팟캐스트 전체가 숙달(mastery)과 위대함에 이르는 프로세스를 탐구하는 데 바쳐졌을 정도로 '과정'에 집착하는 투자자

  • 20년 이상의 자기 자본 투자 경험과, 잭 피셔(Jeff Fischer)·벅 하첼(Buck Hartzell)·NZS 캐피털 같은 멘토 네트워크에서 끌어올린 사고방식을 자신만의 운용 철학으로 응축

  • 그가 특별한 이유는, '품질 우선(quality-first)'을 넘어 '품질만(quality-only)'이라는 한 칸 더 들어간 신념을 포트폴리오 구조·고객 커뮤니케이션·매수 타이밍까지 일관되게 관철한다는 점이다


🎯 비전: '품질 우선'이 아니라 '품질만'

존: 포트폴리오에 대한 저의 비전은 타협 없는 품질(uncompromising quality)입니다. 포트폴리오의 북극성, 즉 길잡이 별은 언제나 제가 최고 품질이라고 생각하는 비즈니스의 주식만을 매수하고, 그 주식을 정말로 오랜 기간 보유하는 것입니다.


"타협 없는 품질"이라고 말할 때, 저는 단순히 "품질 우선"만을 의미하는 게 아닙니다. 어떤 사람들은 이걸 quality-first portfolio라고 부르죠. 저도 그런 의미에서는 품질 우선이 맞습니다. 밸류에이션을 보기도 전에 품질부터 분석하니까요.


하지만 저는 그 이상입니다. 저는 이걸 quality-only(품질만) 포트폴리오라고 생각합니다. 즉, 단지 싸 보인다는 이유로, 혹은 포트폴리오의 평균 PE를 낮추고 싶다는 이유로 품질이 떨어진다고 생각하는 종목을 사지 않습니다.


물론 품질에 대한 제 판단이 틀릴 때도 있고 실수도 많이 할 겁니다. 하지만 제가 보는 방식대로 최상위 품질이 아니라고 판단되는 종목은, 어떤 이유로도 포트폴리오 안에 들이지 않습니다.

image.png


보고밀: 그 철학을 운용에 적용하기 위해 구체적으로 무엇을 바꾸셨나요?

존: 저는 60개, 많아야 70개 정도의 종목으로 구성된 stock universe(주식 유니버스)를 갖고 있습니다.

예전에는 컴퓨터 스크린과 폰의 주식 앱에 300개 종목을 띄워두었습니다. 300개를 따라가다 보면 노이즈가 정말 많죠. 저는 그 노이즈, 그 모든 헛소리를 다 걷어냈습니다.


지금은 금융 데이터 플랫폼이나 폰 앱을 열면 60개 종목만 보입니다. 제가 비즈니스를 충분히 이해하고 장기 확신을 쌓을 만큼 리서치를 끝낸 60개의 종목들이죠.


🛡️ 행정·플래닝은 모두 내려놓고 '주식 선택'만

보고밀: 존, 본격적인 이야기에 들어가기 전에, 지난번 출연 이후 어떻게 지내셨는지 청취자분들께 업데이트해 주시죠.


존: 약 1년 전 베이스천 피듀시어리(Bastion Fiduciary)에 합류했고, 팀의 도움을 받아 올해 1월 23일에 베이스천 산업·인프라 전략(Bastion Industrial and Infrastructure Strategy)을 론칭했습니다. 저는 이 전략의 단독 포트폴리오 매니저로서 포트폴리오의 모든 투자 의사결정을 내립니다.


저는 fiduciary(수탁자)이고, 그 책임을 매우 무겁게 받아들입니다. 그리고 보고밀, 당신의 마음에도 가까운 주제라는 걸 알지만, 저는 세대를 잇는 시계(generational time frame)로 클라이언트의 자본을 운용합니다.


베이스천은 제가 원하는 방식대로, 원하는 시간 지평에 따라 포트폴리오를 운용할 기회와 신뢰를 주었습니다. 그래서 사실상 다른 일을 할 필요가 없어졌죠.


존: 질문에 답하는 한 가지 방식은, 제가 무엇을 안 하는지를 말씀드리는 겁니다.


저는 일반적인 컴플라이언스 요구사항 외에는 행정 업무를 하지 않습니다. 새 클라이언트를 온보딩하지도 않고, 플래너도 아니라서 금융 플랜을 짜지도 않습니다. 제가 운용하는 포트폴리오 바깥의 자산이나 증권에 대한 질문에도 답하지 않습니다. 제가 모르는 것을 아는 척하고 싶지 않거든요.


저는 클라이언트를 위해 오직 하나만 합니다 — 제가 운용하는 그분들 주식 포트폴리오의 한 sleeve(슬리브)를 관리하고, 그 슬리브에 대해 그분들과 소통하는 일.


Roth IRA냐 traditional IRA냐, 529 플랜, Coverdell ESA, whole life, term life, variable life 같은 질문은 받지 않습니다. 베이스천에는 그 일을 사랑하는, 정말 경험 많은 훌륭한 플래너가 두 분 계세요. 그런 질문은 모두 그분들께 넘깁니다.


베이스천 산업·인프라 포트폴리오는 제 분신입니다. 저는 클라이언트를 위해 최고의 종목 선택자, 최고의 포트폴리오 매니저가 되기 위해 모든 걸 최적화할 수 있는 곳에서 일하고 있습니다.


저는 포트폴리오와, 아직 포트폴리오에 없지만 언젠가 편입을 고려할 만한 short list of watch list stocks(짧은 관찰 종목 리스트)를 매우 면밀히 모니터링합니다. 그리고 베이스천 보드, JRo's Notes 뉴스레터, 일대일 이메일과 전화로 클라이언트와 자주 소통하고요.

image.png

⚖️ 포트폴리오 매니저와 애널리스트는 다른 스킬셋

보고밀: 저도 제 커리어에서 두 개의 모자를 쓰고 있다고 느낍니다. 애널리스트의 모자와 포트폴리오 매니저의 모자. 종목 하나하나 깊이 파는 일과, 그 종목들의 컬렉션을 포트폴리오로 엮어내는 일은 다른 작업이잖아요. 그 전환은 어떠셨어요?


존: 정확합니다. 좋은 애널리스트와 좋은 포트폴리오 매니저는 두 개의 다른 스킬셋입니다. 겹치는 부분도 있지만 분명히 다른 스킬셋이에요.


최근 몇 년, 특히 베이스천에서의 지난 1년 동안, 시간의 대다수는 클라이언트를 위해 오래 보유할 고품질 비즈니스들로 어떻게 포트폴리오를 짜낼 것인가를 고민하는 데 썼습니다.


존: 믿거나 말거나, 지금까지 제가 저지른 가장 큰 실수가 바로 그 포트폴리오 구성 단계에서 나왔습니다. 클라이언트 계좌에는 큰 영향을 주지 않았어요. 포트폴리오는 이제 5개월밖에 안 됐고요.


하지만, 저는 32개 종목으로 포트폴리오를 시작했습니다. 그게 가장 큰 실수였다고 생각합니다. 과거의 제 컴포트 존보다 더 많은 종목이었거든요.


저는 늘 더 concentrated and focused(집중되고 좁은) 포트폴리오를 운용해 왔습니다. 모틀리풀(Motley Fool)에서 9년간 모든 애널리스트가 모델 포트폴리오를 운용했는데, 제 포트폴리오는 9년 평균으로 많아야 16~18개 종목이었습니다. 32개는 그냥… 컴포트 존 밖이었어요.


그래서 지금 그걸 고치고 있습니다. 현재는 28개로 줄였고, 시간이 지나면서 25개까지 내릴 거예요. 25개가 제가 머물고 싶은 자리에 훨씬 가깝습니다. 처음부터 포트폴리오 매니지먼트 측면에서 실수를 했지만, 코스 코렉션을 하고 있고 앞으로도 계속할 겁니다.


보고밀: 저는 예전에 20 stocks for 20 years라는 글을 쓴 적이 있어요. 갓 태어난 손주를 위해 한 종목을 골라달라는 클라이언트의 질문에서 영감을 받았죠. 손주는 18살, 20살, 혹은 그 이후까지 그 돈에 손을 대지 않을 거니까 완벽한 클라이언트인 셈입니다.


보고밀: 어떤 비즈니스가 그 기다림을 누릴 자격이 있을까. 100년 동안 존재해온 비즈니스도 많지만, 제가 관심 있는 건 다음 20년을 활용해서 포트폴리오 안에서 의미 있는 일을 해낼 비즈니스입니다.


20개 이상이면 통계적으로 개별 종목 리스크를 상당 부분 분산시킬 수 있다고 알려져 있죠. 4개만 가지고 있으면 여정이 완전히 다르겠지만, 20개 이상이면 본인이나 클라이언트 모두에게 더 편안한 라이드가 됩니다.


존: 저도 그게 제가 과거에 잘 해왔던 영역이라는 걸 알았기 때문에 그렇게 한 측면도 있어요 — 20~25개.

그리고 저는 long tail도 가지고 있습니다. 과거에 정말 안 좋게 끝난 종목들의 주식을 한 주씩, 거의 reminder이자 교훈처럼 남겨둡니다. 1주나 2주씩 들고 있는 20개 종목의 긴 꼬리가 있어요. 일종의 stock journal(주식 일기)이죠. 의미 있는 포지션은 아닙니다.


베이스천 시작 전 제 개인 포트폴리오가 40개였다고 해도, 정말 무게를 지탱하던 건 20개였어요. 그게 제가 늘 편안하다고 느꼈던 자리입니다.


🔑 종목을 늘렸던 진짜 이유 — '부드러운 라이드'의 유혹

보고밀: 초과 종목들이 부담스러운 이유가 워크로드 때문이었나요? 아니면 성과에 부정적이었나요?


존: 좋은 질문이에요. 워크로드 때문은 아닙니다. 저는 60개 회사를 따라가고 있어요. 유니버스가 60개니까요. 포트폴리오 안에 있는 종목들은 당연히 더 많은 관심을 받지만, 워치리스트의 종목들도 분기마다, 혹은 두 분기에 한 번씩은 제 관심을 받습니다. 큰 뉴스라면 당연히 챙기고요.


워크로드가 아니라, 더 집중되고 좁은(concentrated and focused) 포트폴리오가 장기적으로 더 잘할 수 있다는 근본적인 신념 때문이었습니다.


특정 가중치와 익스포저를 좀 더 올리고 싶었는데 그러지 못한 부분도 있고요. 작은 요인들이 많지만, 가장 큰 건 집중에 대한 철학적 신념입니다.


저는 클라이언트들에게 이 포트폴리오에서 무엇을 기대해야 하는지 분명히 커뮤니케이션해 왔습니다. 저는 일부 cyclicals(경기민감주)에도 투자합니다. 산업과 인프라에 투자하니까요. 베타가 높은 종목도 많아요.


솔직히 말하면, 어쩌면 일부 클라이언트들에게 좀 더 부드러운 라이드를 주고 싶었던 마음이 있었던 것 같아요. 그런데 그건 제 본질이 아닙니다. 저는 베타를 위해 포트폴리오를 운용하지 않습니다. 그건 제가 시간을 많이 쏟거나 들여다보는 지표가 아니에요.


그래도 일부 굴곡을 매끈하게 만들어보고 싶어서 컴포트 존보다 더 많은 종목으로 출발했습니다. 하지만 말씀드린 대로 고치고 있고, 포트폴리오는 아직 5개월밖에 안 됐으니 클라이언트 수익에 영향은 없었을 거예요. 일찍 인지하고 교정 중이라는 게 중요합니다.


📈 승자는 달리게, 그리고 복리의 수학

보고밀: 저는 let the winners run(승자를 달리게 한다)는 원칙으로 포트폴리오를 짭니다. 많은 사람들이 어려워하는 부분이죠. 포지션이 일정 비중을 넘으면 안 된다는 멘탈한 혹은 실제 한도가 있어서, 그게 비로소 진짜 기여를 시작하는 순간에 잘라버립니다.


종목 선택은 어렵고 많은 종목이 안 풀리지만, 풀리는 종목들이 분명히 있습니다. 풀리는데 왜 절반으로 잘라요? 매수 사이즈에 한도는 둘 수 있어도, 일단 사고 나면 종목이 두 배, 두 배 더 가게 두는 편입니다. 트리밍은 매우 느리고, 완전히 빠지는 건 더 느리고요. 어떻게 보세요?


존: 절대적으로 동의합니다. 저는 매도를 자주 하지 않습니다. 사실 32개 포지션으로 출발한 게 자책되는 이유 중 하나가, 첫 해 whole turnover(전체 회전율)가 올라가게 만들거든요.


저는 회전율에 대해 자부심이 있습니다. 정말 long-term focused(장기 지향)하고, 매우 인내심이 있고, 시장을 볼 때 감정적으로 안정되어 있으며, 활동이 매우 적고 매매도 거의 안 합니다. 첫 5개월에 이런 일을 겪고 싶지 않았는데 현실이 됐죠. 하지만 본질적으로 저는 승자를 달리게 합니다.


존: 제 좋은 친구 제프 피셔(Jeff Fischer) — 저는 그분이 제 마운트 러쉬모어의 투자자 중 한 명이라고 공개적으로 말해왔습니다 — 가 어제 정도 복리의 기본 수학에 대해 포스팅했어요.

1,000% 오른 주식이 거기서 또 100% 오르면, 그건 1,100% 수익이 아니라 2,000% 수익입니다.

10배에서 단지 100%만 더 가면 20배가 됩니다. 그게 복리의 수학입니다.

저는 역사적으로 승자를 잘 들고 갔습니다. 그게 제가 잘하는 부분이에요. 하지만 잘 못 하는 부분도 있는데, 보고밀, 그건 승자에 추가 매수하는 것입니다.

image.png


존: 제가 운 좋게 잘 사서 그 주식이 10년에 걸쳐 크게 오른다고 칩시다. 가설적으로, 그 상승 전 구간에 걸쳐 averaging up(평균 매입가를 올리며 매수) 할 수도 있었겠죠. 저는 그게 잘 안 됩니다. 성장주 투자자 중에 그걸 정말 잘하는 분들이 많고, 제가 존경하는 분들도 그래요.


행동 편향 중에 anchoring(앵커링)이 있죠. 저는 거기 취약합니다. 낮은 평균 매입단가가 있을 때, 빌 밀러(Bill Miller)의 유명한 인용처럼,

"Low cost basis wins(낮은 평균 매입단가가 이긴다)."

훌륭한 비즈니스에 낮은 코스트 베이시스를 가지고 있으면, 정말 자랑스럽거든요. 제 결점을 좀 드러내는 거지만, 그 낮은 코스트 베이시스가 너무 자랑스러워서 그걸 올리고 싶지 않은 마음이 있습니다. 시간에 걸쳐 부를 복리시키는 데는 추가 매수가 더 나을 수 있는데도요.


그래서 적절할 때 — 무차별적으로가 아니라 — 승자에 추가 매수하는 걸 연습 중입니다. 다만 승자를 들고 가는 것 자체는 역사적으로 잘해왔습니다.


보고밀: 저는 사상 최고가에서 주식을 산 적이 없어요. 그냥 못 하겠더라고요.

이유는 단순합니다. 저는 늘 제가 틀릴 수 있다고 가정합니다. 저는 농담처럼 말하지만, 제가 하는 일에서 '가장 덜 틀린(least wrong)' 사람이 되고 싶습니다. 옳을 필요는 없어요. 많은 사람들이 '옳아야 한다'고 생각하다가 곤란해집니다 — 투자든 다른 일이든.


이번 주에 로버트 핵스트롬(Robert Hagstrom)과 이야기했는데, 그가 버핏에게 가장 어려운 한 가지를 물었더니 버핏이 "favorable outcome(유리한 결과)"라고 답했다고 해요. 산업이나 비즈니스가 유리한 결과를 갖고 있어 보이지만, 산업이 변하고 소비자가 변하고 모든 게 변하면서 그 유리한 결과가 안 나타나는 거죠. 주가가 높을 때는 미래의 유리한 결과가 많이 반영돼 있어서, 일부만 실현돼도 비싸게 산 셈이 됩니다.


보고밀: 저는 클라이언트 포트폴리오에서 처음 산 시점을 들여다보는 걸 좋아합니다. 지금 80달러인 종목을 8달러에 샀던 시점이 언제였지, 하고요....

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

7일 무료 체험 시작하기
이미 계정이 있으신가요?로그인하기
댓글 0개
avatar
호랭교관
구독자 115명구독중 63명
Keep inventing, and don’t despair when at first the idea looks crazy. Remember to wander. Let curiosity be your compass. It remains Day 1.
아직 작성된 댓글이 없습니다.
독서 카테고리의 다른글

Compute 파워가 전부다 — 앤트로픽 CFO 크리슈나 라오

📌 팟캐스트 요약 앤트로픽(Anthropic)의 최고재무책임자 크리슈나 라오(Krishna Rao)가 Invest Like the Best에 출연해, 인류 역사상 가장 흥미로운 시점에 놓인 회사를 안에서 어떻게 운영하는지를 풀어놓는다. 핵심 화두는 단 하나, "컴퓨트(compute)". 그것을 어떻게 사고, 어떻게 배분하고, 어떻게 ROI를 측정하는가. 1년 만에 연간 환산 매출(run rate revenue) 9억 달러에서 30억 달러 이상으로 점프한 회사가, 어떻게 "프론티어 지능(frontier intelligence)의 한계 수익률은 매우 높다"는 단 하나의 명제 위에서 모든 의사결정을 정렬시키는지를 보여준다. AWS·구글·MS의 3개 클라우드와 트레이니움(Trainium)·TPU·GPU 3개 칩 플랫폼을 동시에 쓰는 유일한 랩으로서의 유연성, 그리고 "지능은 IQ가 아니라 다차원적 능력이다"라는 철학이 관통한다. 🎙️ 오늘의 게스트가 중요한 이유 크리슈나 라오(Krishna Rao)는 앤트로픽의 CFO로, 2024년 초 합류해 회사가 2억 5천만 달러 → 30억 달러 이상 ARR로 폭발적으로 성장하는 시기를 재무 리더로서 함께 통과했다. 이전 커리어로는 에어비앤비(Airbnb)에서 팬데믹 한복판의 자본 조달을 주도했고, 블랙스톤(Blackstone)의 PE 그룹에서 경력을 쌓았다 — 즉, '전례 없는 상황에서 명료하게 판단하는 훈련'을 받은 사람이다. 합류 이후 약 750억 달러를 조달했고, 최근 아마존·구글과의 딜로 추가 500억 달러가 들어올 예정이다. 단순 자금 조달이 아니라 '컴퓨트 자본 형성'이라는 새 패러다임의 최전선에 있다. 그의 시간 30~40%가 여전히 컴퓨트에 쓰인다. CFO지만 사실상 '컴퓨트 자원 배분의 총괄' 역할을 한다. 그가 특별한 이유: AI 회사의 재무를 'SaaS 마진'이 아닌 '컴퓨트 envelope에 대한 ROI'라는 완전히 새로운 프레임으로 설명하는 사람이다. 지수적(exponential)으로 성장하는 사업을 선형적(linear) 사고를 가진 인간이 어떻게 운영하는가에 대한 살아있는 사례다. ⚡ 모델은 곧 능력의 다차원 벡터다 — 프론티어 지능의 한계 수익률 크리슈나: 새로운 모델이 나올 때마다, 다른 종류의 능력 세트가 함께 등장합니다. 사람들은 모델 지능을 IQ처럼 생각하는 경향이 있어요. 우리는 다르게 봅니다. 우리에게 지능은 다차원적(multi-dimensional)입니다. 단일 점수가 아니에요. 이 모델의 실제 세계에서의 능력(real-world capability)이 무엇인가? 각 세대의 모델은 더 많은 일을, 더 잘, 더 효율적으로 할 수 있게 해줍니다. 우리가 프론티어 지능의 한계 수익률(returns to frontier intelligence)이 극단적으로 높다고 믿기 때문이죠. 특히 엔터프라이즈에서 그렇습니다. 그게 우리 사업의 핵심 명제(core thesis)입니다. 패트릭: 크리슈나, 이 대화가 정말 기대됐어요. 인류사에서 가장 흥미로운 사업 중 하나를 안에서 들여다보는 분이고, 그것도 가장 흥미로운 시점에서요 — 적어도 기술자라면, 또는 기술을 신경 쓰는 사람이라면요. 바로 본론으로 들어가서, 우리 둘 다 굉장히 열정적인 주제 하나를 묻고 싶습니다. 당신이 매일같이 다뤄야 하는 컴퓨트(compute) 문제요. 당신 일의 핵심이고, 이 회사들이 하는 일의 핵심이고, 거대한 혁명이 그 위에서 일어나고 있죠. 그게 어떤 일인지 풀어주세요. 한때 매일 컴퓨트를 누구에게 얼마나, 왜 배분할지 회의했다고 들었어요. 그 일상 속으로 우리를 데려가 주세요. 🔑 컴퓨트는 사업의 생명선이다 — 캔버스로서의 컴퓨트 크리슈나: 우리가 조달하는 컴퓨트는 우리 사업의 생명선(lifeblood)입니다. 회사에서 가장 중요한 단 하나의 자원이에요. 다른 모든 것이 그 위에 그려지는 캔버스 같은 존재죠. 그래서 컴퓨트를 얼마나 살 것인가에 대한 결정은 회사 전체에서 가장 파급력 크고, 가장 어려운 결정 중 하나입니다. 이렇게 생각해보세요. 너무 많이 사면 회사가 망합니다. 너무 적게 사면 고객을 서빙하지 못하고, 프론티어에 머무를 수도 없죠. 그것도 같은 결과입니다. 우리는 이걸 '불확실성의 원뿔(cone of uncertainty)'이라고 부릅니다. 1기가와트(GW)의 컴퓨트를 그냥 주문해서 다음 주에 배송받을 수 없잖아요. 정말 멀리 앞을 내다보고 계획해야 합니다. 그래서 매우 규율적인 접근을 합니다. 바텀업으로 봅니다. 수요를 모델링하고, 가끔은 틀리고. 프론티어에 머물기 위해 필요한 컴퓨트를 가늠합니다. 그리고 실제 조달 딜을 할 때, 유연성(flexibility)이 정말 중요해요. 딜 자체에 유연성을 박아 넣고, 컴퓨트를 쓰는 방식에도 유연성을 박아 넣습니다. 오늘의 우리에서 우리가 가고 싶은 곳으로 가는 다리를 놓는 방식 — 사업이 지수적으로 성장하는 와중에 — 그건 결국 컴퓨트를 가능한 한 효율적으로 쓰는 것입니다. 지금도 제 시간의 30~40%를 컴퓨트에 쓴다고 보시면 됩니다. 패트릭: "유연성"이 그 맥락에서 정확히 뭘 의미하나요? 크리슈나: 몇 가지 의미가 있어요. 첫째, 우리는 3개의 칩 플랫폼을 씁니다. 아마존의 트레이니움(Trainium), 구글의 TPU, 엔비디아의 GPU — 우리는 이 세 회사 모두의 고객입니다. 그리고 이 칩들을 fungible(상호 대체 가능)하게 사용합니다. 우리가 사들이는 컴퓨트를 보면, 모델 개발에 씁니다. 내부적으로 자체 제품과 모델 개발 속도를 높이는 데 씁니다. 그리고 당연히 고객을 서빙하는 데도 씁니다. 이 세 칩 플랫폼에 걸쳐, 이 모든 내부·외부 용도에 컴퓨트를 사용합니다. 이 유연성은 사실 오래 걸렸어요. 우리가 모든 프론티어 랩 중 가장 효율적으로 컴퓨트를 쓰는 회사가 되기까지 여러 해를 투자했습니다. TPU를 처음 쓰기 시작했을 때, 아마 3세대 TPU였을 거예요. 그때 사람들이 "미쳤어? 다들 GPU 쓰는데 왜 안 써?"라고 했죠. 우리는 그 유연성에 정말 큰 투자를 했고, 각 칩 세대를 내부 워크로드에 가장 잘 맞는 방식으로 매칭시킵니다. 그래서 우리는 모든 종류의 컴퓨트를 유연하게 쓸 수 있게 해주는 오케스트레이션 레이어(orchestration layer)를 직접 구축했어요. 그렇게 함으로써 컴퓨트에서 최대의 가치를 뽑아냅니다. 패트릭: 제가 이걸 제대로 이해하는 건가요? 엔비디아의 CUDA 같은 게 오랫동안 엔비디아 스토리의 일부였잖아요? 하드웨어에 가까이 다가가 많은 것을 할 수 있게 해주는. 가능한 한 베어 메탈(bare metal)에 가깝게 파고들어 통제할 수 있는 변수를 최대한 늘리는 것, 그게 이 유연성의 일부고, 당신이 걸어온 길인가요? 크리슈나: 그 일부 맞습니다. 그런데 동시에 굉장히 협력적이기도 합니다. 우리는 아마존의 안나푸르나 랩스(Annapurna Labs) 팀과 정말 긴밀하게 일하면서 이 칩들의 로드맵에 영향을 미치고 있어요. 우리가 하는 일이 이 칩들의 한계를 정말 짜내고 있다고 믿거든요. 그래서 우리 조직 내부에서는 1달러의 컴퓨트가 다른 어디에서보다 더 멀리 갑니다. 중요한 건, 우리가 회사 내에서 각 칩을 최선의 용도에 맞춰 쓰고 싶다는 거예요. 그래서 자체 컴파일러도 만들고, 칩 레벨부터 위로 쌓아 올리고 있습니다. 그 커스터마이징과 유연성이 가장 큰 ROI를 만들어내는 길이라고 보거든요. 🌪️ 불확실성의 원뿔 — 지수적 성장 위에서 의사결정하기 패트릭: 불확실성의 원뿔(cone of uncertainty) 개념을 설명해주세요. 각 구성 요소도 묻고 싶지만, 그게 컴퓨트 조달과 사용 전체를 사고하는 출발점이자 프레임 같아요. 크리슈나: 사업을 지수적(exponential)으로 키우고 있을 때, 월간이나 주간 성장률의 정말 작은 움직임이 복리로 굴러가면 완전히 다른 결과가 나옵니다. 앞을 내다볼 때, 우리 매출 성장조차 예측하기 정말 어렵습니다. 제가 회사에 합류한 지 2년이 됐는데, 인간은 대체로 선형적(linear)으로 생각하잖아요. 점진적으로요. 그게 제가 스스로 깨야 했던 패러다임입니다. 선형적으로 생각하는 걸 멈추고, 이 지수곡선 위에서 생각하는 것. 지수 곡선 위에서는 결과의 범위가 정말 넓어집니다. 우리는 다양한 시나리오를 봅니다. 1~2년의 기간에 걸쳐 이 불확실성의 원뿔의 여러 지점을 보고, 거기서부터 거꾸로 작업합니다. 우리가 원하는 건 일단 프론티어에 머무는 것입니다. 그게 가장 중요해요. 그리고 고객을 서빙할 수 있어야 하고, 직원들의 일을 가속할 수 있을 만큼의 내부 컴퓨트가 있어야 합니다. 흥미로운 게 있어요. 만약 우리가 직원들에게 "더 이상 우리 모델 못 쓴다"고 말한다면, 그 컴퓨트로 수십억 달러의 매출을 더 서빙할 수 있을 거예요. 하지만 우리는 장기적 관점을 취하고, 원뿔의 위쪽 결과를 향해 베팅합니다. 그러려면 미리 계획해야 하죠. 그게 우리가 규율적으로 컴퓨트를 사는 방식입니다. 가장 중요한 건, 만약 당신이 원뿔의 한 지점에 있는데, 다른 지점을 위해 컴퓨트를 사놓았다면 어떻게 할 것인가? 거기서 컴퓨트 효율성이 정말 우리를 구해줬습니다. 패트릭: 세 가지 버킷 "훈련/연구, 내부 사용, 고객 수요 서빙" 사이의 트레이드오프 대화로 데려가 주세요. 순진하게는 1/3, 1/3, 1/3쯤 될 거라고 생각할 수도 있는데, 얼마나 흔들리나요? 트레이드오프는 어떤가요? 크리슈나: 컴퓨트 조달 회의 외에 컴퓨트 배분(compute allocation) 회의도 자주 합니다. 중요한 건, 이 대화가 우리의 굉장히 협력적인 문화 위에서 일어난다는 점입니다. fiefdom(영지)도 없고, 제로섬(zero-sum)이 아니라 협력적으로 진행됩니다. 하지만 모델 개발에 할당되는 컴퓨트에는 절대 내려가지 않는 하한선(floor)이 있습니다. 고객을 서빙하기 더 어려워지더라도, 좀 부자연스러운 일을 해야 하더라도, 최고의 모델을 개발하는 장기 투자만큼은 멈추지 않습니다. 프론티어 지능의 한계 수익률이 매우 높고, 특히 엔터프라이즈에서 그렇기 때문이에요. 그게 모델 개발 컴퓨트의 바닥(floor)을 만들어줍니다. 그리고 내부 컴퓨트 사용은 모델 개발 속도를 높이고, 컴퓨트 효율 배수(compute efficiency multipliers)를 찾는 데 도움을 줍니다. 각 달러의 컴퓨트에서 더 많은 것을 얻게 해주는 그 배수들요. 이런 대화에서 각 팀이 그 컴퓨트로 뭘 할지 자기 입장을 대변합니다. 그리고 우리는 ROI에 대해 정말 솔직하고 열린 토론을 합니다. 컴퓨트를 매우 동적으로 배분할 수 있어서, 상대적으로 짧은 시간 안에 조정이 가능해요. 📊 효율성이 능력과 함께 간다 — 세단에서 스포츠카로 패트릭: 효율성이 정말 흥미로워요. 1년 전 당신들의 내부 벤치마크 대비 얼마나 더 효율적인지 감이 있나요? 또 다른 랩들 대비요? 효율성을 어떻게 측정하나요? 크리슈나: 몇 가지 방식으로 생각할 수 있어요. 모델 관점에서 사람들이 갖는 비유는 새 모델이 나올 때마다 자동차처럼 본다는 거예요. 전에 세단이 있었고, 이제 그 세단의 상위 버전이 있고, 점점 위로 올라가는 거죠. 모델 지능 관점에서는 그 비유가 맞습니다. 그 비유가 깨지는 지점은, 사람들이 "세단에서 스포츠카로 가면 연비는 훨씬 나빠지겠지"라고 생각한다는 거예요. 스포츠카는 연비 보고 사는 게 아니잖아요. 그런데 우리 경우엔 능력의 거대한 향상과 모델 효율성의 향상이 동시에 일어납니다. Opus 4 → 4.5 → 4.6 → 4.7로 가는 각 도약을 보세요. 같지 않은 도약들이지만, 각 도약마다 토큰 처리 효율성에 배수(multiplier)가 붙어요. 그게 고객만 도와주는 게 아닙니다. 내부적으로도 도움이 돼요. 생각해보면, 모델로 강화학습(reinforcement learning)을 할 때, 그건 본질적으로 샌드박스 안의 추론 + 리워드 함수잖아요. 모델이 더 효율적인 추론을 한다면 RL도 더 효율적이 됩니다. 그래서 우리는 윈윈을 합니다. 고객은 새 모델이 나올 때마다 더 많은 능력을 얻고, 우리는 그 모델을 종종 이전 세대보다 몇 배 더 효율적으로 서빙할 수 있게 되죠. 그리고 세대와 세대 사이에는, 큰 모델 변화 같은 계단함수(step function) 사이사이에서, 효율성 개선을 동적으로 배포합니다. 시간이 가면서 항상 더 효율적이 됩니다. 그 연료가 되는 게 연구팀이에요. 모델 능력 R&D, 컴퓨트 효율 R&D, 고객 서빙, 내부 워크로드, 모두가 연결되어 있어요. 때로는 아직 출시되지 않은 모델을 내부에서 써서 워크로드를 가속하기도 합니다. 🎯 프론티어에 머무는 것의 수익률이 정말 높다 패트릭: "프론티어에 머무는 것의 수익률이 정말 높다" — 아까 정말 중요한 얘길 했어요. 가능한 한 자세히 설명해주세요. 말로는 당연해 보이지만, "6개월 된 모델 쓰면 비용도 일부니까 따라잡으면서 쓰면 돼"라고 하는 진영도 있잖아요. 그런데 그게 안 통했어요. 저도 소비자로서, Opus 4.7이 나오면 바로 스위치를 켜요. GPT 5.5가 나오면 또 그쪽으로 가고. 최고를 원하니까요. 크리슈나: 몇 가지 이유가 있습니다. 새 모델이 나올 때마다 다른 능력 세트가 나와요. 사람들은 모델 지능을 IQ처럼, 하나의 숫자로 봅니다. "이 모델은 110이었는데 125가 됐어." 우리는 다르게 봐요. 지능은 다차원이고, 단일 점수가 아닙니다. 다들 모델 벤치마크 카드를 발표하지만, 그 벤치마크들 중 상당수는 이미 포화(saturated)됐어요. 우리도 발표는 합니다만. 우리가 진짜로 측정하는 건 고객들이 우리에게 하는 말 "이 모델의 실제 세계 능력이 어느 정도인가?"입니다. 더 나은 모델을 출시할수록, 단순한 raw IQ만이 아니라 장기 호라이즌 태스크(long horizon tasks)를 수행하는 능력, 도구 사용·컴퓨터 사용(tool use, computer use) 능력, 에이전트 태스크(agentic tasks)를 더 빨리 수행하는 능력이 같이 올라가는 걸 봅니다. 직원 두 명이 똑같이 유능한데 한 명은 일주일 걸려서 과제를 끝내고, 다른 한 명은 하루 만에 끝낸다고 해봐요. 후자가 계속 그 페이스를 유지하면, 그 사람은 7배 더 나은 사람이 되는 거예요. 같은 능력이지만 시간이 다른 거죠. 이 모든 게 고객 경험에 녹아듭니다. 새 모델을 출시할 때마다 TAM(전체 시장 규모)이 새롭게 열립니다. 더 많은 TAM이 열리고, 더 많은 유스케이스가 가능해집니다. 좋은 예가 우리가 지난 4개월간 회사에서 본 것이에요. 우리는 올해를 약 90억 달러(annual run rate revenue)로 시작해서, 분기를 30억 달러 이상(quarterly run rate) 넘게 마쳤습니다. 그런 변화는 모델 지능의 도약, 그리고 그 위에서 만든 제품들이 가능하게 만든 거예요. 그게 "프론티어 지능의 수익률이 정말 높다"는 말의 의미입니다. 이건 엔터프라이즈에서 특히 그래요. 소비자 쪽에서는 그렇게 쉽게 보이지 않아요. 소비자가 모델 한계를 그렇게까지 밀어붙이지는 않거든요. 엔터프라이즈에서는, 처음엔 코딩에서 시작했지만 이제 그 너머로 굉장히 의미 있게 확장됐어요. 각 모델 세대가 더 많은 일을, 더 잘, 더 효율적으로 할 기회를 주고, 고객은 그걸 봅니다. 그러고는 새 모델에 더 많은 토큰을 투자합니다. 이 사이클이 계속 반복돼요. 🔁 재귀적 자기개선 — 모델이 모델을 만든다 패트릭: 프론티어를 미는 일은 어렸을 때 읽던 공상과학소설 같아요. 메이저 랩들이 어떤 임계점에 도달한 것 같습니다. 당신 팀의 누군가가 최근에 재귀적 자기개선(recursive self-improvement)이라는 말을 했더라고요 — 모델 자체가 다음 세대 모델을 위한 연구의 상당 부분을 한다고요. 당신이 미는 프론티어, OpenAI가 미는 프론티어를 오픈소스 모델들과 비교하면, 당신들이 거기 먼저 도착함으로써 격차가 더 벌어질 수도 있겠다는 생각이 듭니다. 모델 안의 재귀적 자기개선이라는 개념을 어떻게 봐야 하나요? 거기 먼저 도달하는 게 굉장히 중요해 보이거든요. 크리슈나: 우리는 진보가 가속되고 있다고 봅니다. 다른 회사들에 대해 말할 수는 없지만, 우리한테는 스케일링 법칙(scaling laws)이 살아있고 잘 작동합니다. 최근 출시들 — 예를 들어 Mythos 같은 경우를 봐도요. 지금 회사 내부에서 우리 코드의 90% 이상이 Claude Code로 작성됩니다. Claude Code의 상당수가 Claude Code로 작성되고 있어요. 이게 우리가 왜 내부에 컴퓨트를 할당하는지, 왜 매출을 일부 포기하는지를 보여줍니다 — 모델 자체가 다음 세대 모델을 만드는 걸 돕고 있거든요. 스케일링 법칙에서 오는 능력 도약 외에도, 인재(talent)가 정말 중요합니다. 그 인재가 ...
독서
2026. 05. 21
8
2
128
Compute 파워가 전부다 — 앤트로픽 CFO 크리슈나 라오

투자로 인생을 바꾸려면 인생을 걸어라(피터케이님 책을 읽고)

주공남 시절 팟캐스트에서 보고 블로그글로만 뵙던 피터케이님의 책이 나와서 바로 보았다. 술술 잘 읽히는 초심자를 위한 실전 사례/마인드 관리 책이었다. 투자에서 가장 위험한 사람은 한 번도 틀리지 않은 사람이 아니라, 틀렸는데도 자신이 왜 틀렸는지 모르는 사람일지 모르는 사람이다. 시장은 늘 그럴듯한 이야기를 들려준다. 새로운 산업, 새로운 제품, 새로운 기술, 새로운 시대. 그러나 시간이 지나고 나면 그중 일부만 실제 매출이 되고, 그중 더 적은 일부만 이익이 되며, 더 적은 일부만 주가의 장기 상승으로 이어진다. 시나리오를 쓰고 투자하는...그 연습의 결과가 나오기까지는 약 2년이 걸렸고, 그 이전에 10년에 가까운 실패의 시간이 있었다. 그 덕분에 내 오답 노트는 아주 두꺼워졌다. 그러다 보니 한 가지는 분명해졌다. ‘이건 물릴 것 같다’는 감각이 생긴 것이다. 틀린 답을 너무 많이 써봤기 때문에, 같은 실수를 반복하지 않는 힘이 생겼다. 이 문장은 투자에서 경험이 어떻게 실력으로 바뀌는지를 잘 보여준다. 단순히 오래 했다고 실력이 느는 것은 아니다. 피터케이님도 약 10년은 수익 없이 손실을 많이 봤다가 한다. 주공남을 시작하고 네이버 카페를 만들어서 혼자 공부한 내용을 올리고 하면서 성장이 시작되었다고 함. 오래 복기하고, 오래 부끄러워해야 조금씩 나아진다. 시장에서 얻은 손실은 그냥 사라지는 돈이 아니라, 제대로 기록하면 다음 판단을 지켜주는 방어막이 된다. 투자에서 중요한 것은 “정답을 찾는 능력”보다 “오답을 제거하는 능력”이라는 생각을 했다. 좋은 투자자는 모든 기회를 잡는 사람이 아니라, 치명적인 실수를 줄이는 것부터 시작한다. 특히 성장주 투자는 늘 화려한 미래를 말하기 때문에 더 그렇다. 미래가 아름답게 보일수록, 그 미래가 실제 매출과 이익으로 연결되는지를 봐야 한다. 책에서 나오는 사례중 인터플렉스는 LCD에서 OLED로 넘어가는 구조적 전환을 보았고, 반도체 장비주에서는 삼성전자의 대규모 투자가 후방 기업의 발주로 이어지는 구조를 보았다. F&F 투자에서는 중국 소비 시장 현장에 가서 매장, 동선, 소비 패턴을 직접 보았다. 중요한 것은 “좋아 보인다”가 아니라 “돈이 어디서 새로 생기는가”였다. 투자는 추상적인 기대를 사는 게임처럼 보이지만, 결국에는 아주 구체적인 질문으로 돌아온다. 누가 돈을 쓰는가. 무엇이 새로 팔리는가. 그 매출은 반복될 수 있는가. 이익률은 올라가는가. 경쟁자는 따라올 수 있는가. 이 질문에 답하지 못하면, 아무리 멋진 스토리도 언젠가 가격 앞에서 무너진다. 재능보다 중요한 것: 매일 생각하는 사람의 공부 밀도 투자에는 재능이 필요하다는 말이 있다. 어느 정도는 맞을 수 있다. 그보다 더 중요한 것이 있다고 말한다. 바로 공부의 밀도다. 투자에 필요한건 재능이 아니라 공부의 밀도다. 확신을 가지기 위해 그만큼 파고든 것이다. 그 정도가 되어야 남의 말에 흔들리지 않는다. 그리고 남에게도 설명할 수 있다. 흔히 말하는 2분 요약, 핵심 투자 아이디어를 짧은 시간 안에 말로 풀어낼 수 있어야 한다. 더 나아가, 한 기업에 대해 어떤 질문이 들어와도 한두 시간은 충분히 이야기할 수 있어야 한다. 어떤 기업을 2분 안에 설명할 수 있는가. 반대로 어떤 질문이 들어와도 한두 시간은 이야기할 수 있는가. 이 두 기준은 서로 모순되는 것 같지만 사실은 같다. 깊게 아는 사람만 짧게 말할 수 있다. 얕게 아는 사람은 길게 말하지만 핵심이 없다. 깊게 아는 사람은 짧게 말해도 구조가 보인다. 매출이 어디서 생기고, 이익이 왜 늘고, 시장은 무엇을 오해하고 있으며, 내가 틀렸다면 어떤 지점에서 틀릴 수 있는지를 설명할 수 있다. 이 정도가 되어야 비로소 남의 말에 흔들리지 않는다. 여기서 김연아 선수의 비유도 인상적이다. 동작을 유튜브로 수백 번 본다고 해서 바로 빙판 위에서 구현할 수는 없다. 투자도 마찬가지다. 책을 읽고, 리포트를 보고, 강의를 듣는 것은 필요하지만, 그것만으로는 부족하다. 돈이 들어가는 순간 감정이 개입한다. 손실이 나면 논리가 흔들리고, 남들이 벌면 내 속도가 불안해진다. 그래서 투자는 머리로 배우는 동시에 몸으로 익히는 일이다. 투자도 그렇다. 실전까지 가는 데 보통 3년 이상은 걸린다. 그런데 대부분의 사람들은 그전에 포기한다. 공부는 하는데 계좌를 보면 엉망이다. 특히 시장이 안 좋을 때, 가장 많이 시장을 떠난다. 대부분은 실력이 생기기 전에 시장을 떠난다. 계좌가 먼저 상처를 입고, 마음이 먼저 무너진다. 그래서 3년을 버틴다는 것은 단순히 시간을 채운다는 뜻이 아니다. 시장이 나를 조롱하는 시간, 내가 틀렸다고 느끼는 시간, 아무리 공부해도 성과가 나오지 않는 시간을 견디는 일이다. 투자는 ...
독서
2026. 05. 21
14
4
145
투자로 인생을 바꾸려면 인생을 걸어라(피터케이님 책을 읽고)

순다르 피차이가 구글 CEO가 말하는 2026년 AI의 진짜 병목

순다르 피차이 (Sundar Pichai) — 인물 소개 Sundar Pichai는 구글(Alphabet)의 CEO로, 2025년 기준 CEO 재임 10년을 넘겼습니다. 구글은 현재 세계 최대 테크 기업 중 하나이자 AI 레이스의 선두 그룹으로, 2026년 CapEx를 1,750억~1,850억 달러 규모로 집행할 계획입니다. 본 인터뷰는 Patrick Collison과 Elad Gil이 진행했으며, Transformer 역사부터 Gemini, TPU, Waymo, Isomorphic, Quantum, 우주 데이터센터까지 Alphabet의 풀스택 전략을 폭넓게 다룹니다. 인터뷰 핵심 정리 Transformer가 구글에서 태어났음에도 ChatGPT로 선점당한 이유에서 시작해, 2025년 여름 "구글은 끝났다"는 서사가 어떻게 뒤집혔는지, 그리고 2026년 AI 산업의 진짜 병목이 무엇인지까지의 흐름을 정리했습니다. 1. Transformer가 구글 안에서 제품화되지 못한 것은 '연구-제품 괴리'가 아니다 피차이는 흔한 서사(구글은 Transformer를 만들고도 제품화에 실패했다)를 정면으로 반박합니다. Transformer는 번역 개선이라는 제품 문제를 풀기 위해 시작되었고, BERT·MUM을 통해 Search 품질에 즉시 투입되어 역대 최대급 품질 점프를 만들어냈다는 것입니다. 검색 품질을 종교적으로 측정하는 구글이 BERT·MUM을 넣자 검색 품질은 경쟁자 대비 가장 크게 앞서나간 구간을 만들어냈습니다. 내부적으로 LaMDA를 통해 ChatGPT의 초기 버전에 해당하는 제품도 이미 존재했습니다. 다만 "한 엔지니어가 이게 sentient하다고 주장할 만큼" 강력했지만, RLHF가 끝나지 않은 toxic한 버전이었기에 출시 기준(search quality bias)을 통과하지 못했습니다. I/O 2022에 AI Test Kitchen이라는 이름으로 constrained 버전을 공개한 바 있습니다. → 검색 품질 기준이 높은 조직일수록 '출시 문턱'이 높다는 역설은 기존 사업이 큰 빅테크에게 일반적으로 적용되는 구조적 약점입니다. 2. 속도(Latency)는 단순 UX가 아니라 기술 스택의 성적표 Jeff Dean이 2012년 Google Brain으로 고양이를 인식시킨 순간부터, 구글은 속도를 제품 경쟁력의 핵심 지표로 삼아 왔습니다. 피차이는 속도를 "제품의 기술적 기반이 잘 되어 있는지를 드러내는 거울"로 정의합니다. Search 팀의 서브팀들은 밀리초(ms) 단위 Latency Budget을 배정받습니다. 3ms를 줄이면 1.5ms는 본인 budget으로 적립, 1.5ms는 유저에게 전가 — 팀별로 10~30ms를 운용합니다. 지난 5년간 Search Latency를 30% 개선했습니다. 같은 기간 기능은 폭발적으로 늘었음에도 말입니다. Gemini의 Flash 모델은 Pro 모델 대비 약 90%의 capability를 유지하면서 압도적으로 빠르고, TPU 수직통합이 이 파레토 프론티어를 지탱합니다. → Flash 모델이 Pro의 90% capability를 90% 이하 비용으로 낸다면, 토큰 단가 경쟁에서 구글은 구조적 우위를 확보. 이는 API 판가 경쟁력으로 직결됩니다. 3. 검색은 사라지지 않고 '에이전트 매니저'로 진화한다 "10년 뒤에도 검색이 있을까?"라는 질문에 피차이는 '진화한 버전'이라고 답합니다. 정보 탐색 쿼리 대부분은 agentic해지고, 사용자는 여러 개의 스레드를 동시에 돌리게 된다는 것입니다. 검색은 '한 줄짜리 프롬프트 + 랭킹된 결과 리스트'에서 '여러 에이전트를 오케스트레이트하는 매니저'로 바뀝니다. 이미 AI Mode에서는 deep research 쿼리가 돌아가고, 피차이 본인도 Antigravity에서 에이전트들을 작업시키며 제품 형태의 변화를 체감하고 있다고 밝힙니다. 핵심 프레임은 'zero-sum이 아니다'입니다. YouTube가 TikTok·Instagram 등장 이후에도 성장한 사례를 들며, 가치 창출의 곡선이 훨씬 더 가팔라지므로 검색과 Gemini는 겹치면서도 발산할 것이라고 봅니다. → '검색 vs. 챗' 대결 프레임은 과잉 단순화. 검색이 에이전트 매니저로 바뀐다면 쿼리당 monetization은 오히려 상승할 여지가 있습니다. 4. 2025년 여름 '구글은 끝났다'가 뒤집힌 이유는 풀스택 때문 2025년 봄·여름, 구글 주가는 150달러 수준까지 눌렸고 시장은 "검색 비즈니스 모델이 끝났다"고 봤습니다. 피차이는 이를 "Overton window가 그 순간 shift한 것"이라 표현하며, 회사는 2016년 I/O에서 TPU를 공개한 이래 AI-first로 운영되고 있었다고 강조합니다. "프런티어 LLM에서는 뒤쳐졌지만, 풀스택 — 연구 · 인프라 · 플랫폼 · 제품 — 역량은 전부 내부에 있었습니다. 실행만 하면 되는 상황이었습니다." Gemini 2.5가 진짜 전환점이었고, 특히 멀티모달리티에서 선두로 올라선 것이 외부 perception을 뒤집었습니다. Nano Banana 같은 제품이 구글의 기술 스택이 통합되어 있음을 드러내는 대표 사례로 언급됩니다. 현재 프런티어는 "두세 개의 랩이 매달 엎치락뒤치락" 하는 상황이라고 정리합니다. → "full-stack"이 레토릭이 아니라 실제 TPU 7세대까지 이어진 10년짜리 자본 지출의 결과라는 점이 핵심. 수직통합의 누적효과는 단기 퍼포먼스 차이보다 multiple로 더 크게 반영됩니다. 5. AGI-pilled 논쟁은 의미론적 허구다 경쟁 랩 연구자들이 "구글은 AGI-pilled하지 ...
독서
2026. 04. 21
16
0
219
순다르 피차이가 구글 CEO가 말하는 2026년 AI의 진짜 병목

손자병법으로 보는 워렌 버핏

Tobias Carlisle — 인물 소개 Tobias Carlisle은 Acquirers Fund 창립자이자 포트폴리오 매니저로, 깊은 가치 투자(Deep Value Investing)의 저자이다. 최근 저작 '손자병법으로 보는 워렌 버핏: 고대의 리스크 관리 기술(Soldier of Fortune: Warren Buffett, Sun Tzu, and the Ancient Art of Risk-taking)'에서 버핏의 투자 철학과 동양의 전략 고전을 결합한 새로운 해석을 제시한다. 그는 버핏의 의사결정 과정에서 손자병법의 세 가지 핵심 원칙이 구현되고 있음을 발견했다. 인터뷰 핵심 정리 이 인터뷰는 워렌 버핏의 투자 철학과 의사결정이 2,500년 전 동양 전략서인 손자병법과 어떻게 맞닿아 있는지를 탐구하는 세션이다. Carlisle은 버핏의 거래들을 재해석하면서, 우리가 알고 있던 성공 사례들이 실은 다른 각도에서 보면 훨씬 더 깊은 의미를 지닌다는 점을 드러낸다. 1. 손자병법의 세 가지 핵심 원칙: 절대 불패성, 전투 없는 승리, 무적의 강자 버핏의 투자 철학 전체를 설명하는 가장 간단한 프레임은 손자병법의 세 가지 개념으로 압축된다. 첫째, 절대 불패성(invincibility)은 실패하지 않기를 의미한다. 두 번째, 전투 없는 승리(victory without conflict)는 싸우지 않고 이기는 것이고, 셋째 무적의 강자(unassalable strength)는 공격받을 수 없는 방어진을 구축하는 것이다. 생존의 원칙이 모든 것의 기초이다. 버핏이 투자 세계와 인생에서 강조하는 것은, 파산이나 죽음 같은 최종성(finality)이 있는 게임에서는 그 최종성을 피하는 것이 무엇보다 중요하다는 것이다. 따라서 "성공은 실패하지 않음으로써 달성된다"는 원칙이 모든 의사결정의 중심에 놓인다. → 이 부분이 가장 중요한 인사이트인데, 일반적인 "최대 수익" 추구와는 정반대의 철학입니다. 생존 우선이 모든 투자 의사결정의 출발점이어야 합니다. 2. 제너럴리 거래: 방어적 거래로 위기를 뚫다 1998년 제너럴리 재보험사 인수는 당시 버핏의 투자자들을 당황게 했다. 그 이유는 버핏이 평소 강조하던 원칙을 정반대로 실행하는 것처럼 보였기 때문이다. 맥락: 1997년 코카콜라 투자가 14배 수익을 거둔 후, 버크셔 해서웨이 주식은 3배 프리미엄을 받고 있었던 반면 코카콜라는 50-60배 PER로 평가받았다. 만약 코카콜라 가격이 하락하면 버크셔의 주가에 큰 영향을 미칠 수 있는 상황이었다. 버핏의 해결책은 손자병법의 "방어 우선(defend first)" 원칙을 적용한 것이었다. 그는 제너럴리와의 합병을 통해: 버크셔의 고비용 주식(고PER)으로 저비용 자산(일반 리이의 채권 포트폴리오)을 인수 코카콜라 지분을 희석시키되, 버크셔 주주에게 대부분의 가치 귀속 2000년 폭락장에서 채권이 랠리(수익률 하락으로 가격 상승)하면서 완벽한 헤지 구성 2000-2001년 IT 거품 붕괴 때 제너럴리의 채권 포트폴리오가 상승하면서, 버크셔는 저평가된 주식을 계속 매수할 자원을 확보했다. 결과적으로 향후 25년간 버크셔의 기초를 다지는 거래가 되었다. 그 과정에서 취한 파생상품 포트폴리오에서 $400M 손실이 발생했으나, 2008-2009년 금융위기 때 이 파생상품들이 터지면서(AIG 등 보험회사 연쇄 파산), 버핏의 조기 정리 결정이 실은 "최고의 거래"였음이 밝혀졌다. → 버핏이 이 거래에 대해 "파생상품은 대량살상무기"라고 쓴 것 때문에 시장은 실패로 해석했지만, Carlisle은 이를 손자병법의 "정보 은폐(don't let people know what you're doing)" 전술로 본다. 훌륭한 거래임을 드러내면 추후 같은 기법을 반복할 수 없기 때문이다. 3. 애플: 전투 없는 승리의 교과서 2010년대 애플 투자는 버핏의 "전투 없는 승리(victory without conflict)" 원칙을 가장 명확하게 보여준다. 선행 조건: 2010년대 초 데이비드 아인혼(David Einhorn)과 칼 아이칸(Carl Icahn)이 애플의 과다 현금(150억 달러)을 이유로 적극적인 기업 활동 개입을 주도 아인혼은 애플 선호주(iPrefs) 발행, 아이칸은 주식 자사매입 추진 아이칸의 압박과 팀 쿡의 순응으로 자사매입 프로그램 시작, 아인혼과 아이칸은 수익을 거두고 철수 버핏의 움직임: 몇 년 뒤 조용히 애플 주식을 매수하기 시작, 최종적으로 $40B(버크셔 자본의 상당 비중) 투입 2016년 이후 애플 주식은 160억 달러로 4배 증가 특별한 저항, 협상, 대립 없이 "자연스럽게" 대량 주식 매수 이것이 손자병법의 "전투 없는 승리"의 정의: 싸우지 않고 이기기. 아인혼과 아이칸은 전투를 벌였고, 버핏은 관찰하고 기다렸다가 최적의 시점에 조용히 들어갔다. $40B를 단일 종목에 투입할 수 있는 투자자는 ...
독서
2026. 04. 21
3
0
43

AI 인프라 전쟁의 진짜 병목은 GPU가 아니다 — 딜런 패텔

📌 팟캐스트 요약 빅테크 4사의 2025년 합산 CapEx 약 $6,000억, 공급망 포함 시 $1조 규모에 달하며 그 대부분은 '즉시 지출'이 아닌 2027~2029년을 위한 선투자다. Anthropic은 보수적 컴퓨트 전략으로 올해 심각한 용량 부족에 처했고, OpenAI는 공격적 계약으로 훨씬 많은 컴퓨트를 선점했다. H100 렌탈 가격은 하락하지 않고 오히려 상승 중이며, GPU 감가상각 논쟁에서 '수익 가치 기반 가격 책정'이 '성능 대비 가격 하락' 논리를 이기고 있다. 반도체 공급망의 최종 병목은 ASML의 EUV 장비 생산 능력이며, 2030년까지 연간 100대 수준에 불과하다. 현재의 진짜 병목은 전력이나 데이터센터가 아니라 로직 웨이퍼와 메모리, 즉 반도체 제조 자체다. 🎙️ 오늘의 게스트가 중요한 이유 딜런 패텔은 반도체·AI 인프라 전문 리서치 기관 SemiAnalysis의 CEO다. 그는 빅테크 하이퍼스케일러의 실제 CapEx 지출 구조, TSMC 웨이퍼 할당 현황, 클라우드 컴퓨트 계약 구조 등 외부에서 접근하기 어려운 공급망 데이터를 추적하고 분석한다. AI 인프라 투자 열풍의 실체를 숫자로 검증할 수 있는 몇 안 되는 독립 분석가 중 한 명이다. 이 에피소드는 드워키시의 자택에서 녹화됐으며, 딜런은 드워키시의 룸메이트이기도 하다. 드워키시: 이번 에피소드는 룸메이트가 반도체를 가르쳐주는 에피소드입니다. 그리고 이 세트를 마지막으로 사용하는 날이기도 하죠. 딜런: 맞아요. 한 번 쓰고 나면 다시 못 쓰겠다는 생각이 들거든요. "이제 여기서 나가야 해." 드워키시는 두 번 쓴 건 안 됩니다. 💰 $6,000억 CapEx의 실체 — 언제, 어디에 쓰이는가 드워키시: 딜런은 SemiAnalysis의 CEO입니다. 딜런에게 드리고 싶은 가장 뜨거운 질문이 있어요. 아마존, 메타, 구글, 마이크로소프트 — 이 빅4의 올해 합산 예상 CapEx를 당신이 최근 발표했는데 $6,000억이더군요. 연간 렌탈 가격 기준으로 환산하면 약 50기가와트에 해당합니다. 물론 올해 50기가와트를 실제로 켤 수는 없겠죠. 그렇다면 이 돈의 상당 부분은 향후 몇 년에 걸쳐 가동될 컴퓨트를 위해 지금 지불하는 것이겠고요. 이 CapEx가 실제로 가동되는 타임라인을 어떻게 봐야 할까요? 드워키시: 비슷한 맥락에서 AI 랩들 얘기도 하고 싶습니다. OpenAI는 방금 $1,100억을 조달했고, Anthropic은 $300억을 조달했습니다. 올해 온라인으로 가동되는 컴퓨트를 딜런이 얘기해줘야겠지만, 총합이 4기가와트 정도 되나요? 드워키시: 1기가와트짜리 컴퓨트를 렌탈로 운영하는 데 드는 비용이 기가와트당 $100억~$130억이라고 합니다. 그렇다면 이번 라운드 조달액만으로도 올해 컴퓨트 지출을 커버하기에 충분하고, 여기에 올해 벌어들일 매출은 포함도 안 됩니다. 그렇다면 두 가지를 이해하고 싶어요. 첫째, 빅테크 CapEx가 실제로 가동되는 시간 스케일은 어떻게 되나요? 둘째, 랩들은 연간 기가와트당 $130억인데 도대체 이 돈을 왜 이렇게 많이 조달하는 건가요? 딜런: 이 하이퍼스케일러들의 CapEx가 $6,000억 수준이고, 공급망 전체를 더하면 $1조 수준이 된다고 할 때, 그 중 일부는 올해 바로 온라인이 될 컴퓨트를 위한 것입니다. 즉, 올해 지불되는 칩 비용과 기타 CapEx 항목들이죠. 그런데 상당한 부분이 셋업 CapEx입니다. 딜런: 올해 미국에서 20기가와트의 용량이 신규로 추가된다고 할 때, 그 CapEx의 일부는 사실 작년에 이미 지출됐습니다. 예를 들어 구글의 $1,800억 중 상당 부분은 2028~2029년용 터빈 보증금으로 나가고, 일부는 2027년 데이터센터 건설비로, 또 일부는 전력 구매 계약 선불금으로 지출됩니다. 이 모든 것이 초고속 스케일링을 위한 미래 준비 비용입니다. 이는 모든 하이퍼스케일러와 공급망 전반에 해당하는 얘기입니다. 딜런: 대략 올해 배포되는 20기가와트 중 많은 부분이 하이퍼스케일러 몫이고, 일부는 그 외 업체들 몫입니다. 이 모든 회사들의 가장 큰 고객은 Anthropic과 OpenAI입니다. 현재 이 두 곳은 각각 2~2.5기가와트 수준이며, 훨씬 더 빠르게 스케일업하려 하고 있습니다. 🔥 Anthropic의 컴퓨트 위기 — 보수적 전략의 대가 딜런: 지난 몇 달간 Anthropic의 행보를 보면, 월 $40억~$60억 수준으로 매출이 추가됐습니다. 이 속도로 직선 연장하면 다음 10개월 동안 $600억의 추가 매출이 발생합니다. 그게 비관적인 시나리오라고 주장하는 사람도 있을 정도입니다. 딜런: 이 $600억 매출에서, 미디어가 보도한 Anthropic의 현재 매출총이익률을 적용하면 약 $400억의 인퍼런스 컴퓨트 지출이 필요합니다. 기가와트당 렌탈 비용 약 $100억 기준으로, 4기가와트의 인퍼런스 용량을 추가해야 한다는 계산이 나옵니다. 이건 연구·개발 트레이닝 플릿이 현 수준을 유지한다는 가정에서의 수치입니다. 즉, Anthropic은 올해 말까지 5기가와트 이상에 도달해야 합니다. 드워키시: 그 얘기에서 짚고 싶은 게 있어요. Anthropic이 올해 말까지 5기가와트에 도달하기 어렵다면, 그리고 예상보다 훨씬 폭발적으로 성장한 매출도 서비스해야 하고, 내년 모델 경쟁력을 위한 연구·트레이닝도 해야 한다면 — 그 용량은 어디서 가져와야 하는 건가요? 딜런: Dario는 당신 팟캐스트에서 굉장히 보수적인 입장을 취했죠. "매출이 예상과 다른 속도로 꺾일 수 있으니 컴퓨트에 미치지 않겠다. 파산하고 싶지 않다. 책임감 있는 스케일링을 하겠다"고 했습니다. 그런데 현실에서 Anthropic은 OpenAI에 비해 완전히 뒤처졌습니다. OpenAI의 전략은 "그냥 미친 듯이 계약을 체결하자"는 거였거든요. OpenAI는 올해 말까지 훨씬 많은 컴퓨트를 확보해 놨습니다. 드워키시: 그렇다면 Anthropic이 급하게 컴퓨트를 구해야 할 때 어떤 상황이 벌어지나요? 네오클라우드로 가야 하는 건가요? 그쪽 컴퓨트가 더 떨어지나요? 어떤 측면에서 더 열등한가요? 막판에 계약하면 클라우드 제공업체에 더 높은 마진을 지불해야 하나요? 그 예비 용량은 누가 만들어 놓은 건가요? 딜런: 예비 컴퓨트를 구하는 측면에서 보면, 하이퍼스케일러에도 일부 용량이 있습니다. 모든 컴퓨트 계약이 5년 장기 계약은 아니니까요. 2023~2024년 혹은 2025년 H100들 중 단기 계약 형태로 운영되는 것들이 있습니다. 딜런: OpenAI 컴퓨트의 대부분은 5년 계약으로 체결됐지만, 다른 고객들 중에는 1년, 2년, 3년, 또는 6개월 온디맨드 계약도 많았습니다. 이런 계약들이 만료될 때, 가장 높은 가격을 기꺼이 지불할 시장 참여자가 그 용량을 가져갑니다. 그래서 H100 가격이 크게 반등해서 올라가고 있는 것입니다. 사람들은 $2 이상으로도 장기 계약을 체결하려 합니다. 딜런: 어떤 AI 랩들은 2~3년짜리 H100 계약을 시간당 $2.40에 체결하는 것도 봤습니다. Hopper 한 대를 5년 기준으로 배포하는 비용이 시간당 $1.40이라는 점을 생각해보면, 이미 2년을 쓴 장비를 2~3년 더 $2.40에 계약한다는 건 마진이 엄청나게 높다는 겁니다. 이렇게 되면 Amazon, CoreWeave, Together AI, Nebius 등 다른 공급업체들을 시장에서 밀어낼 수 있습니다. 딜런: 이런 네오클라우드들은 Hopper 비중이 높았고 — 상대적으로 더 공격적으로 Hopper를 매입했거든요 — 동시에 단기 계약을 선호했습니다(CoreWeave 제외). 그래서 Hopper 용량이 어느 정도 시장에 있기는 합니다. Oracle이나 CoreWeave의 경우, Blackwell 관련 물량은 장기 계약으로 이미 팔렸습니다. 이번 분기에 온라인이 되는 물량은 이미 다 나갔고요. 일부는 Nebius, Microsoft, Amazon, Google 등에서 데이터센터 지연으로 약속한 수량을 맞추지 못하는 경우도 있습니다. 딜런: 그러나 네오클라우드와 일부 하이퍼스케일러 중에는 아직 팔리지 않은 용량, 또는 강력한 AGI 지향 용도가 아닌 내부 용도로 배정했다가 이제 판매로 전환할 수 있는 용량도 있습니다. 혹은 Anthropic이 모든 컴퓨트를 직접 보유할 필요도 없습니다. Amazon이 컴퓨트를 갖고 Bedrock을 통해 서비스하거나, Google이 Vertex를 통해, Microsoft가 Foundry를 통해 서비스하면서 Anthropic과 매출 분배를 하는 방식도 가능합니다. 드워키시: 즉, Anthropic은 매출의 50% 수준의 마진을 지불하거나 — 매출 분배 형태로 — 아니면 일찍 확보했더라면 내지 않아도 됐을 스팟 컴퓨트 할증료를 지불하는 상황이라는 거죠. 딜런: 맞아요, 트레이드오프가 있습니다. 하지만 동시에 한동안 4개월이나 모두가 OpenAI에게 "당신들과는 계약 안 한다"고 했던 것도 사실입니다. 말도 안 된다 싶지만, 이유는 간단했어요: "돈이 없잖아요." 지금은 다들 "OpenAI, 처음부터 믿었어요. 이제 돈이 생겼으니 어떤 계약이든 할 수 있습니다"라고 합니다. Anthropic은 그 반대 방향으로 제약을 받고 있습니다. Anthropic의 매출이 폭발적으로 성장하는 이 능력 단계에 도달한 다른 구매자가 아직 없기 때문에 더욱 그렇습니다. 📉 H100 감가상각 논쟁 — GPU는 정말 빠르게 낡는가 드워키시: 흥미로운 점을 짚으셨어요. 최고의 모델을 보유하는 것 자체는 극도로 빠르게 하락하는 자산처럼 보일 수 있습니다. 3개월 후면 더 이상 최고 모델이 아니니까요. 하지만 그게 중요한 이유는 그 상태일 때 미리 계약을 체결하고, 컴퓨트를 선점하고, 좋은 가격을 잠글 수 있기 때문이라는 거죠. 드워키시: 그리고 적어도 최근까지, 사람들이 GPU의 감가상각 주기에 대해 큰 이슈를 제기했습니다. Michael Burry 같은 베어들은 "GPUs의 실제 수명은 2년이며, 기술이 워낙 빠르게 발전하니 2년 감가상각이 맞다"고 주장했습니다. 이렇게 되면 연간 상각 CapEx가 늘어 클라우드 구축이 재무적으로 덜 매력적이 됩니다. 그런데 당신은 반대로 감가상각 주기가 5년보다도 더 길 수 있다고 시사하고 있습니다. 2030년에 "7나노 팹을 다시 돌려야 한다, A100도 다시 켜야 한다"고 할 상황이 오면, 실제 감가상각 주기가 상당히 길어지는 셈이죠. 이게 꽤 흥미로운 재무적 시사점이라고 생각합니다. 딜런: 여러 줄을 함께 풀어봐야 할 것 같네요. 하나는 GPU 감가상각이 어떻게 되느냐는 거고요. 먼저 이전 질문에 미처 답하지 못했는데, Anthropic은 자체적으로 그리고 Bedrock, Vertex, Foundry를 통한 제품 서비스까지 합산해 올해 말까지 5기가와트 안팎, 어쩌면 조금 더 도달할 수 있을 것으로 봅니다. 5~6기가와트까지는 가능하지 않을까 생각합니다. 초기 계획 대비 훨씬 상회하는 수치입니다. OpenAI도 비슷하고, 우리 수치 기준으로는 실제로 조금 더 높습니다. 어쨌든 GPU 감가상각 주기로 돌아가서요. Michael Burry의 주장은 3년 이하입니다. 이 문제를 바라보는 두 가지 렌즈가 있습니다. 첫 번째는 기계적 관점입니다. GPU의 총소유비용(TCO) 모델인데, GPU의 가격을 프로젝션하고 클러스터의 총비용을 구성합니다. 비용 항목에는 데이터센터 비용, 네트워킹 비용, 장비 교체를 위한 인력 비용, 스페어 파츠, 실제 칩 비용, 서버 비용 등이 포함됩니다. 신용 비용과 감가상각 기간 등을 적용하면, H100 한 대를 5년 감가상각 기준으로 대량 배포 시 시간당 $1.40이라는 수치가 나옵니다. 5년짜리 시간당 $2 계약을 체결하면 매출총이익률이 약 35%이고, $1.90이면 역시 35% 안팎입니다. 그리고 5년이 지나면 GPU는 버스에서 떨어진 것처럼 폐기된다고 가정합니다. 장기 계약 없이 단기로 운영하는 경우의 반박 논리는 이렇습니다. NVIDIA가 2년마다 성능을 3~4배 올리면서 가격은 2배 혹은 50% 상승하는 데 그치니, H100의 시장 가치는 2024년에 $2였다가 2026년에는 Blackwell이 대량으로 풀리면서 시간당 $1으로 떨어질 것이라는 겁니다. 그리고 Rubin이 2027년에 대량 배포되면서 또 3배 성능이 오르면, Hopper의 가치는 시간당 $0.70으로 내려갑니다. GPU 가격이 계속 하락할 것이라는 시나리오죠. 그런데 두 번째 렌즈가 있습니다. 그 칩에서 끌어낼 수 있는 실용적 가치가 무엇이냐는 질문입니다. 만약 Rubin을 무한정 만들 수 있다면, 네, 바로 그 시나리오대로 됩니다. 새 칩이 나올수록 Hopper 스팟 가격이 떨어지겠죠. 하지만 반도체와 배포 타임라인이 극도로 제한되어 있기 때문에, 이 칩들의 가격을 결정하는 것은 "오늘 살 수 있는 대안"이 아니라 "이 칩에서 오늘 뽑아낼 수 있는 가치"입니다. 예를 들어 GPT-5.4를 봅시다. GPT-5.4는 GPT-4보다 훨씬 싸게 돌릴 수 있고, 활성 파라미터 수도 훨씬 적습니다. GPT-5.4가 희소한 MoE(Mixture of Experts)이고 GPT-4가 더 거친 MoE였다는 점에서, 파라미터 관점에서 훨씬 작습니다. 트레이닝, RL, 모델 아키텍처, 데이터 품질 등 다양한 측면에서 발전이 있었고, 그 결과 GPT-5.4는 GPT-4보다 품질이 훨씬 높으면서도 서비스 비용이 저렴합니다. H100 한 장에서 GPT-5.4를 GPT-4보다 훨씬 더 많은 토큰으로 서비스할 수 있습니다. GPT-4 토큰의 최대 TAM이 수십억 달러 규모였다면, GPT-5.4의 TAM은 아마 $1,000억 이상입니다. 물론 채택에 시간이 걸리고, 경쟁도 있고, 지속적인 개선도 있지만, 만약 여기서 개선이 멈춘다면 H100의 가치는 GPT-4 기반 수익이 아닌 GPT-5.4 기반 수익을 얼마나 뽑아낼 수 있느냐에 달리게 됩니다. 이런 다이나믹이 상당히 흥미로운 것은, H100이 3년 전보다 오늘 더 가치 있다는 점입니다. 이건 정말 말도 안 되는 얘기인데 — 실제로 그렇습니다. 드워키시: 진정한 AGI 모델이 개발된다면, 서버에서 진짜 사람이 돌아간다면 — 뇌가 처리하는 플롭 수에 대한 추정은 손파도 같은 수치들이지만 — 플롭 기준으로 H100은 일부 추정치에서 인간 뇌와 비슷한 1e15 수준으로 봅니다. 물론 메모리는 뇌가 훨씬 큽니다. H100은 80GB인 반면, 뇌는 페타바이트급일 수 있다는 얘기도 있죠. 딜런: 아, 페타바이트를 갖고 있다고요? 1과 0의 페타바이트를 나열해봐요. 문자열 하나만 대보세요. 드워키시: 그게 사실 핵심이에요. 아니요, 우리는 그냥 역대 최고의 희소 어텐션 기법을 갖고 있는 거죠. 진지하게 생각해보면, 압축된 정보량 측면에서는 페타바이트가 맞을 수도 있어요. 인간 뇌는 극도로 희소한 MoE이니까요. 어쨌든, 인간 지식 근로자가 연간 6자리 수의 가치를 만들어낸다고 가정해봅시다. 만약 H100이 그에 근접한 가치를 만들어낼 수 있다면, 진짜 사람을 서버에 올린 셈이 된다면 — H100 한 장의 가치는 불과 몇 달 안에 자체 비용을 회수하는 수준입니다. 제가 Dario를 인터뷰할 때 하려던 말의 핵심은 이겁니다. 특이점이 2년 후에 온다고 생각하는 게 아닙니다. 물론 매출 측면에서 Dario가 더 많은 컴퓨트를 사야 한다는 건 분명하지만요. 제가 지적하려 했던 건, Dario 스스로의 말 — "2년 안에 천재들로 가득 찬 데이터센터", 최대 5년 안에 — 과 그 데이터센터가 수조 달러의 매출을 낼 것이라는 주장을 전제하면, 컴퓨트에 보수적이라는 진술과 OpenAI보다 덜 공격적이라는 진술이 내부적으로 모순된다는 겁니다. 그 지적이 묻혀버린 건, 사람들이 저를 "팟캐스터가 수천억짜리 기업 CEO한테 올인하라고 설득하려 한다"고 디스하기 바빴기 때문입니다. 저는 단지 Dario 자신의 발언들이 서로 모순된다는 걸 지적하려 했을 뿐이에요. 딜런: 모델이 이렇게 강력해질수록 GPU의 가치가 시간이 갈수록 높아진다는 관점으로 돌아가면, 지금은 OpenAI와 Anthropic만이 그 관점을 갖고 있습니다. 하지만 더 멀리 나아갈수록 모든 사람이 GPU당 가치가 폭발적으로 증가하는 걸 볼 수 있게 됩니다. 그렇기 때문에 지금 당장 컴퓨트를 커밋해야 한다는 거죠. 재미있게도, Anthropic 스타일로 말하자면, 그들이 커밋 이슈가 있다는 밈이 있습니다. 일종의 폴리아머러스 성향이랄까. Dario 얘기가 아니라 이게 밈이 됐다는 건데... 드워키시: 모든 걸 설명해주는 것 같네요. 그런데 흥미로운 경제 효과가 있어요. Alchian-Allen 효과라는 겁니다. 품질이 다른 두 상품에 동일한 고정 비용을 추가하면, 사람들은 한계적으로 더 높은 품질의 상품을 선택하게 된다는 이론입니다. 구체적으로, 맛있는 사과가 $2이고 평범한 사과가 $1이라고 하죠. 이제 수입 관세가 붙으면 각각 $3과 $2가 됩니다. 두 상품 모두 $1 올랐지만, 이전에는 2배 비쌌던 좋은 사과가 이제는 1.5배만 비쌉니다. 가격 비율이 달라진 거죠. AI에 적용하면, GPU 가격이 올라가 컴퓨트 비용에 고정비가 추가될 경우, 사람들이 "어차피 컴퓨트에 이 돈을 쓸 것이니, 조금 더 내더라도 최고 모델을 쓰겠다"고 생각하게 된다는 겁니다. Hopper가 $2에서 $3으로 올랐다고 하면, Opus 100만 토큰과 Sonnet 200만 토큰을 만들 수 있는 Hopper 한 장에서 Opus와 Sonnet의 가격 차이가 줄어드는 겁니다. GPU 가격이 $1 오르면서 상대적 차이가 좁혀지기 때문에요. 딜런: 맞아요, 상당히 이해가 되는 얘기입니다. 실제로도 지금 가장 높은 거래량과 가장 많은 매출이 최상위 모델에 집중되어 있습니다. 컴퓨트 제한적 세계에서는 두 가지 일이 벌어집니다. 첫째, 커밋 이슈 없이 5년 장기 계약을 체결한 기업들은 엄청난 마진 우위를 확보합니다. 2~3년, 5년 전 가격에 컴퓨트를 잠갔으니까요. 반면 5년 계약 중 3년이 지나고 나서 다른 기업의 2~3년 계약이 만료되어 현재 가격에 다시 사야 한다면, 모델 가치에 기반한 가격 책정으로 인해 훨씬 비쌉니다. 일찍 커밋한 기업이 일반적으로 더 좋은 마진을 가집니다. 장기 계약 비중이 단기나 유연 계약 비중보다 훨씬 큽니다. 동시에 마진은 어디로 가느냐는 문제가 있습니다. 모델이 더 가치 있어질수록 클라우드 플레이어들이 가격을 어느 정도까지 올릴 수 있을까요? CoreWeave를 예로 들면, 현재 평균 계약 기간이 3년 이상이고 컴퓨트의 98% 이상이 3년 이상 계약입니다. 이런 상황에서 가격을 실제로 유연하게 올리기 어렵습니다. 하지만 매년 전년도보다 훨씬 많은 용량이 추가되고 있습니다. 올해만 해도 Meta는 2022년 WhatsApp, Instagram, Facebook 서비스 + AI를 위해 보유했던 전체 컴퓨트 및 데이터센터 규모만큼을 이번 한 해에 추가합니다. 이게 올해 신규 추가 물량 하나입니다. Meta뿐 아니라 CoreWeave, Google, Amazon 등 모든 기업들이 매년 엄청난 양의 컴퓨트를 추가하고 있습니다. 이 새로운 컴퓨트는 새로운 가격에 거래됩니다. OpenAI가 작년에 600메가와트에서 2기가와트로, 올해 2기가와트에서 6기가와트 이상으로, 내년에 6에서 12기가와트로 스케일업한다면 — 비용의 대부분은 과거 장기 계약이 아니라 신규로 추가되는 컴퓨트에 있습니다. 그 증분 컴퓨트의 가격을 누가 책정하느냐가 관건이고, 그건 인프라 제공업체들입니다. 🔑 공급망 주도권 — Nvidia는 어떻게 모든 카드를 쥐었나 딜런: 클라우드 플레이어들, 네오클라우드, 하이퍼스케일러들이 마진을 어느 정도는 받을 수 있지만, 상류로 올라가면 메모리와 로직 용량을 모두 갖고 있는 곳은 대부분 Nvidia입니다. Nvidia는 많은 장기 계약을 체결했고, 오늘 기준 $900억의 장기 계약이 있으며, 현재 메모리 벤더들과도 3년 계약을 협상 중입니다. Amazon과 Google은 Broadcom을 통해, Amazon은 직접, 그리고 AMD와도 연결됩니다. 이 기업들이 용량을 선점했기 때문에 모든 카드를 쥐고 있습니다. TSMC는 가격을 올리지 않고 있지만, 메모리 벤더들은 상당히 가격을 올리고 있습니다. 가격을 두 세 배 올릴 것이며, 동시에 장기 계약도 체결하고 있습니다. 마진을 쌓을 수 있는 곳은 클라우드, 칩 벤더, 메모리 벤더이고, 언젠가는 TSMC나 ASML이 "우리도 훨씬 많이 받겠다"고 나설 수도 있습니다. 하지만 동시에 모델 벤더들이 미친 마진을 쌓을 수 있을까요? 적어도 올해는 모델 벤더들의 마진이 크게 상승할 것입니다. 용량 제약이 너무 심해서 수요를 파괴해야 하는 상황이기 때문입니다. Anthropic도 지금 속도로는 수요를 파괴하지 않고는 계속할 수가 없습니다. 드워키시: 로직과 메모리로 들어가 봅시다. Nvidia가 어떻게 이 두 가지를 이렇게 많이 확보할 수 있었나요? 당신 수치 기준으로 2027년까지 Nvidia가 N3 웨이퍼 용량의 70% 이상을 차지할 것이고, SK Hynix와 Samsung 메모리에서도 상당한 비중을 갖게 됩니다. 딜런: 네오클라우드 비즈니스가 어떻게 작동하는지, Nvidia가 어떻게 연결되는지 생각해보세요. 혹은 RL 환경 비즈니스와 Anthropic의 관계도 마찬가지입니다. 두 경우 모두 Nvidia는 의도적으로 보완 산업을 분열시켜 최대한 많은 레버리지를 유지하려 합니다. 어느 한 곳이 모든 컴퓨트를 갖지 못하도록 무작위 네오클라우드들에게 할당을 배포하는 거죠. 마찬가지로 Anthropic이나 OpenAI도 데이터 제공업체와 일할 때 "하나의 공급업체에 잠기지 않도록 이 업계 자체를 크게 키우겠다"고 합니다. 드워키시: 그렇다면 왜 TSMC는 3나노 공정에서 — Trainium 3, TPU v7, 기타 가속기들이 들어갈 공정인데 — Nvidia에게 다 내주고 있는 걸까요? 시장을 분열시키려 하지 않는 이유가 있나요? 딜런: 몇 가지 포인트가 있습니다. 3나노 공정으로 가면, 작년 기준 대부분이 Apple이었습니다. Apple은 2나노로 이동 중이고요. 메모리 가격이 올라가면 Apple의 물량이 줄어들 수 있습니다. 메모리 가격이 상승하면 Apple이 마진을 깎든지 이동하든지 해야 하는데, 어쨌든 장기 계약이 있어서 시간 지연이 있지만 Apple이 수요를 줄이거나 2나노로 더 빠르게 이동할 가능성이 높습니다. 현재 2나노는 모바일 칩만 가능하고, 향후 AI 칩도 이동할 예정입니다. TSMC의 HPC(고성능 컴퓨팅), AI 칩에 대한 마진이 모바일보다 높습니다. 모바일보다 HPC에서 우위가 더 크기 때문입니다. TSMC의 계산을 보면, CPU를 만드는 기업들에게 아주 좋은 할당을 제공하고 있습니다. Amazon이 Trainium과 Graviton 둘 다 3나노에 있는데, Graviton이 CPU고 Trainium이 AI 칩입니다. TSMC는 Trainium보다 Graviton 할당에 훨씬 더 열정적입니다. CPU 사업이 더 안정적이고 장기적인 성장세를 보인다고 보기 때문입니다. 빠른 성장률 시장에 모든 증분 용량을 할당하기 전에, 더 낮은 성장률을 가진 안정적인 시장에 먼저 할당하는 것이 보수적인 기업의 일반적인 접근 방식입니다. AMD의 CPU 할당도 마찬가지로 TSMC가 GPU 할당보다 훨씬 더 우호적으로 봅니다. Nvidia는 좀 독특합니다. CPU도 있고, 스위치도 만들고, NVLink, InfiniBand, 이더넷, NIC 등 네트워킹도 합니다. 올해 말까지 Rubin 출시와 함께 이 제품군 대부분이 3나노로 이동할 예정이며, 가장 중요한 건 GPU입니다. 그런데도 Nvidia가 공급의 대부분을 가져가는 건, TSMC를 비롯한 공급망이 시장 수요를 예측하는 방식 때문이기도 합니다만, 시장 신호가 더 중요합니다. Nvidia가 Google이나 Amazon보다 훨씬 일찍 비취소, 비반환 조건의 장기 계약을 체결하고 심지어 보증금까지 지불했기 때문입니다. Google과 Amazon은 걸림돌이 있었습니다. 칩 하나가 몇 분기 지연되는 일도 있었고, Trainium 관련 이슈들도 있었죠. 반면 Nvidia는 "더, 더, 더, 더"를 외쳤습니다. TSMC는 공급망 전체를 점검했습니다. Victory Giant 같은 중국 최대 PCB 공급업체에 "PCB 용량이 충분합니까?"를 묻고, 메모리 벤더들에게 "메모리 용량은?" 을 확인하면서 Nvidia가 요구하는 물량을 맞출 수 있다고 확인했습니다. 결국 누가 AGI에 충분히 확신이 있어서 말도 안 돼 보이는 수준의 장기 공약을 하느냐의 문제입니다. AGI에 확신이 없는 사람들에게는 이상해 보이지만, 미래에 그 비율이 완전히 다를 것이라 믿으며 기꺼이 좋은 마진에 지금 서명하는 기업들이 있습니다. 이것이 반도체 공급망에서도 똑같이 작동합니다. 드워키시: Nvidia가 AGI를 믿는다고는 생각하지 않아요. Jensen은 소프트웨어가 완전히 자동화될 거라거나 그런 걸 믿는 것 같지 않거든요. 그는 "가속 컴퓨팅"이라고 부르죠, AI 칩이라고 하지 않고. 딜런: AI 칩이 맞습니다. "가속 컴퓨팅"은 더 넓은 개념이에요. 물리 모델링과 시뮬레이션도 포함됩니다. 하지만 그가 주요 사용 사례를 정면으로 받아들이지 않는 느낌이 있어요. 저는 Jensen이 이해하고 있다고 생각합니다. 다만 Dario나 Sam처럼 AGI에 완전히 설득된 건 아닌 것 같습니다. 그래도 작년 3분기의 Google이나 Amazon보다는 훨씬 더 AGI에 가깝고, 훨씬 더 많은 수요를 봤습니다. 이유는 간단합니다. 데이터센터 건설이 눈에 보이니까요. "좋아, 이 시장 점유율을 갖고 싶다"는 거죠. 우리가 추적하는 데이터센터도 많고, 어느 벤더 것인지 불분명한 것들도 있습니다. 어느 정도는 Google과 Amazon 모두, 특히 Google은 TPU가 자체 배포에 더 좋음에도 불구하고, TPU만으로는 데이터센터를 다 채울 수 없어서 엄청난 양의 GPU도 배포해야 합니다. 팹에서 TPU를 충분히 만들 수 없는 거죠. 드워키시: Google이 TPU v7, 즉 Ironwood를 Anthropic에게 100만 장 판매했다는 얘기가 있는데, 당신은 지금 당장 그리고 앞으로도 주요 병목이 로직과 메모리 — 칩을 만드는 데 필요한 것들 — 이 될 것이라고 했습니다. Google에는 DeepMind가 있고, 3대 주요 AI 랩 중 하나입니다. 이 병목이 이렇게 심각하다면 왜 DeepMind에 주지 않고 팔아버린 건가요? 딜런: 다시, 이건... DeepMind 직원들은 "이게 말이 됩니까? 왜 이런 결정을 한 거죠?"라고 했습니다. 하지만 Google Cloud 직원들과 Google 경영진은 다른 사고 과정을 가졌습니다. 저와 당신 모두 Anthropic의 컴퓨트 팀을 알고 있습니다. 핵심 인물 두 명 모두 Google 출신이에요. 그들이 이 불균형을 포착하고 협상을 진행해 Google이 인지하기 전에 컴퓨트 접근권을 확보했습니다. 우리 데이터에서 파악한 사건의 순서는 이렇습니다. Q3 초, 약 6주에 걸쳐 TPU 용량이 대폭 증가했습니다. 그 6주 동안 여러 차례 요청이 있었고, Google이 갑작스러운 용량 증가를 TSMC에 설명해야 할 정도였습니다. 이 증가의 상당 부분은 Anthropic에게 판매하기 위한 것이었고, Anthropic이 Google보다 먼저 기회를 봤던 겁니다. 그 뒤 Nano Banana와 Gemini 3가 나오면서 Google의 사용자 지표가 폭발했습니다. 그제야 Google 경영진이 "아, 이런" 하게 된 거죠. 그 뒤 Google이 "6개월마다 컴퓨트를 두 배로 늘려야 한다"는 발언을 하기 시작했습니다. 많이 깨어났고, TSMC에 "더 달라, 더 달라"고 했습니다. TSMC는 "미안한데, 다 팔렸어요. 2026년에는 5~10% 더 드릴 수 있지만, 2027년 물량을 작업해야 합니다"라고 답했고요. 제가 보기에 랩들 사이에 정보 비대칭이 있었습니다. 정확히는 모르지만, 공급망 웨이퍼 주문 데이터와 Anthropic·Fluidstack이 체결한 데이터센터 계약 데이터를 보면서 제 나름의 스토리를 구성했습니다. Google이 실수를 했다는 건 분명합니다. Gemini ARR을 보면 확인됩니다. Q1~Q3는 거의 없다가 Q3 후반부터 좀 올라왔고, Q4에서야 ARR $50억에 달했습니다. Google이 처음엔 매출이 폭발하는 걸 못 봤던 거죠. 어떤 의미에서 Anthropic도 ARR이 폭발하기 전까지는 커밋 이슈가 있었습니다. 훨씬 많은 정보 비대칭 속에서 미래를 보면서도 그랬습니다. Google은 Anthropic보다 더 보수적인 데다 ARR도 훨씬 낮았으니 당연히 더 망설였겠죠. 이후 Google은 에너지 회사를 인수하고, 터빈에 보증금을 내고, 전력 토지를 대규모로 매입하고, 유틸리티 회사들과 장기 계약을 협상하는 등 데이터센터·전력 측면에서 매우 공격적으로 움직이고 있습니다. 작년 말부터 Google이 크게 각성했다고 봅니다. ⏳ 2030년 최후의 병목 — ASML과 EUV의 한계 드워키시: AI 컴퓨트 스케일링을 막는 병목이 매년 ...
독서
2026. 03. 20
11
0
170
AI 인프라 전쟁의 진짜 병목은 GPU가 아니다 — 딜런 패텔