AMD · ARM Holdings · Intel 심층 분석
2026년 4월
여러 투자의견을 참고해 종합하여 클로드를 활용해 작성하였고, 재미나이를 이용해 이미지를 만들었습니다.
Executive Summary
CPU의 귀환 — 에이전트 AI가 만든 새로운 투자 테마
테마 요약
AI가 '말하는 기계(챗봇)'에서 '행동하는 기계(에이전트)'로 진화하면서 AI 인프라의 병목이 GPU에서 CPU로 이동하고 있다. Georgia Tech·Intel 논문(2025.11)은 에이전트 워크플로우 레이턴시의 50~90%가 CPU 처리에서 발생한다는 것을 실측으로 확인했다. Morgan Stanley는 이로 인한 증분 서버 CPU TAM을 2030년까지 최대 $60B으로 추정하며, 서버 CPU 시장 전체가 2025년 $27B에서 2030년 $100B 이상으로 성장할 것으로 전망한다.
이 변화는 2026년 들어서야 시장이 본격적으로 인식하기 시작했다. NVIDIA의 독립형 Vera CPU 출시(GTC 2026.3), ARM의 AGI CPU 공개(2026.3.24), Intel의 Q1 2026 어닝 서프라이즈(2026.4.23)가 연속으로 이 테마를 확인해주고 있다.
종목 별 핵심 판단

핵심 리스크
• CPU 수요 분산 — 독점자 부재로 파이 성장 대비 개별 기업 수혜 희석. 엔비디아식 단일 포착 구조 없음
• 서버 교체 사이클 — 수요 가시화까지 2~3년 소요. 수익화 속도가 GPU보다 느림
• 선반영 부담 — AMD(+163%)와 ARM(PEG 3.47)은 이미 상당한 기대치 반영
• Intel 파운드리 리스크 — 이익 정상화 시계가 길고 18A 수율 불확실
• 경쟁 심화 — AWS Graviton, Google Axion 등 하이퍼스케일러 자체 CPU가 x86 수요 잠식 가능
에이전트 AI CPU 테마에 베팅한다면, 테마 판단만큼 종목 선택이 중요하다. 안정적 복합 수혜: AMD. 장기 구조 수혜: ARM. 비대칭 턴어라운드: Intel.
본 리포트는 투자 참고용이며, 특정 종목의 매수·매도를 권유하지 않습니다. 투자 결과의 책임은 투자자 본인에게 있습니다.
1. 왜 지금 CPU인가
1.1 패러다임 전환: 챗봇에서 에이전트로
2022년 말 ChatGPT 등장 이후 AI 인프라 투자는 GPU 중심으로 흘러왔다. 모델을 학습(training)하고 추론(inference)하는 작업이 대규모 병렬 연산을 요구했기 때문이다. GPU가 AI 붐의 주인공이 된 데는 충분한 이유가 있었다.
그러나 2025~2026년을 기점으로 AI의 사용 방식이 근본적으로 바뀌고 있다. '챗봇(chatbot)' — 질문을 받고 답변을 생성하는 단방향 모델 — 에서 '에이전트(agent)' — 계획을 세우고, 도구를 호출하고, 실행하고, 결과를 검증하는 자율적 시스템 — 으로의 전환이 일어나고 있다.
이 전환이 인프라 구조를 바꾼다. 챗봇 워크플로우에서 CPU는 단순히 토큰을 GPU로 전달하는 보조 역할에 그쳤다. 에이전트 워크플로우에서 CPU는 전체 오케스트레이션의 지휘자가 된다.
"CPUs are becoming the bottleneck in terms of growing out this AI and agentic workflow." — Dion Harris, NVIDIA 인프라 총괄 (GTC 2026)
1.2 에이전트 워크플로우: CPU가 바빠지는 이유
에이전트 AI의 작업 흐름을 단계별로 보면 CPU가 얼마나 중심적인 역할을 하는지 명확해진다.

챗봇과 에이전트의 핵심 차이는 '루프'다. 챗봇은 요청 1회 → 응답 1회의 단순 구조다. 에이전트는 하나의 태스크를 완료하기 위해 수십~수백 번의 추론-실행-검증 사이클을 반복한다. 이 사이클의 속도를 결정하는 것이 CPU다.
1.3 데이터가 말하는 CPU 병목의 규모
Georgia Tech와 Intel이 2025년 11월 공동 발표한 논문(arXiv:2511.00739)은 5가지 대표 에이전트 워크플로우를 실측했다.
에이전트 워크플로우에서 CPU 툴 처리(tool processing)가 전체 레이턴시의 50~90.6%를 차지한다. RAG에서는 검색, 코딩 에이전트에서는 bash/Python 실행, 리서치 에이전트에서는 API 파싱이 각각 병목이다. — Georgia Tech & Intel, 2025
vLLM 팀의 자체 분석도 같은 방향을 가리킨다. H100 GPU에서 Llama 3 8B를 실행할 때 HTTP 서비스가 33%, 스케줄링·입력 준비가 29%를 차지해 실제 GPU 연산은 38%에 불과했다. GPU가 Blackwell 세대로 더 빨라질수록 이 CPU 병목은 오히려 심화된다.

1.4 CPU:GPU 비율의 구조적 역전

1.5 시장이 이제 막 인식하기 시작했다는 신호들
• NVIDIA Vera CPU 독립 출시 (GTC 2026.3) — GPU 회사가 CPU를 독립 제품으로 출시. 시장 구조 변화의 가장 직접적 확인
• OpenAI-AWS $38B 계약 (2025.11) — 언론은 GPU를 조명했지만, 계약서에는 '에이전트 확장용 CPU 수천만 개 확보 옵션'이 명시됨
• Intel·AMD 서버 CPU 가격 인상 (2026 Q1 말) — 공급 제약과 수요 증가 동시 발생. Intel CFO '절대적으로 공급이 제약된 상태'
• Morgan Stanley 리포트 (2026.4) — 에이전트 AI 증분 CPU TAM $32.5~60B 추정
• ARM AGI CPU 출시 (2026.3.24) — IP 라이선서가...






