Vera Rubin Decoded Pt. 6 | 공급망 마스터 레퍼런스

시리즈 안내 ⎯ Series Map

Part 1: 플랫폼 개요와 아키텍처 맵 — Blackwell → Rubin 플랫폼의 핵심과 주요 사양
Part 2: Rubin GPU 엔지니어링 심층 분석 — process node, SM, HBM4, NVLink-C2C, 패키지, CPX와 Groq 3 LPX
Part 3: Vera CPU와 네트워킹 실리콘 제품군 — Vera CPU, NVLink 6 Switch, ConnectX-9, BlueField-4, Spectrum-6
Part 4: 랙 조립 — 트레이, PCB, 쿨링 — HGX와 NVL72, 컴퓨트 트레이 모듈, cableless 미드플레인, PCB 업그레이드, 액체 냉각
Part 5: 랙 전력과 네트워킹 fabric — 전력 공급, HVDC, tray ↔ rack 배선, scale-up NVLink 6, scale-out InfiniBand와 Ethernet
Part 6 (현재 글): 공급망 마스터 레퍼런스 — sub-system별 공급사 정리

⚠️ 확정적인 공급사 목록이 아니라, 정보를 토대로 한 추정. 이 파트는 공개적으로 접근 가능한 리서치와 institutional 데이터 — sell-side 애널리스트 노트, 공급사 실적 발표, OCP / GTC 공시, 한국·대만 산업 리포트, 주요 기업 공시 — 를 한데 모아 정리한 educated guess다. Vera Rubin 플랫폼 전반의 벤더 관계, 점유율 분할, 매출 배분은 대부분 NDA로 제한된다. 따라서 아래 내용은 권위 있는 출처가 아니라 방향성 레퍼런스로 받아들이는 편이 안전하다 — 수치와 공급사 매핑에는 빠진 부분, 오기, 잘못된 추정이 섞여 있을 수 있고, 전체적인 산업의 흐름 자체도 빠르게 움직이고 있다.

📝 범위 — 부품 제조사로 한정. 이 파트가 다루는 대상은 Vera Rubin 플랫폼 안에 들어가는 부품을 만드는 공급사다 — 실리콘 파운드리, 메모리, PCB / CCL, copper foil, 액체 냉각, 전력 공급, NVLink optic, scale-out 네트워킹, 시스템 어셈블리 파트너 등이 여기에 해당한다. 완성된 시스템을 재판매용으로 조립하는 서버 시장 OEM / ODM (Dell, HPE, Lenovo, Supermicro 류)은 범위 밖이며, 이 파트에서는 다루지 않는다.

공급사를 sub-system별로 가로질러 보는 시각이다. 엔지니어링 맥락은 Part 2 / Part 3 (칩) 그리고 Part 4 / Part 5 (tray-to-rack 어셈블리 + 전력 + 네트워킹 fabric)를 함께 보면 좋다.

Sub-System Index

Silicon — Logic & Memory
Substrate, PCB & CCL
Liquid Cooling
Rack-Level Power Delivery
NVLink 6 — Scale-Up Interconnect
PCIe 6.0 / Internal Interconnect
Quantum-X800 — InfiniBand Scale-Out
Spectrum-X — Ethernet Scale-Out
System Integration & Assembly
Cross-Subsystem Heatmap

1. Silicon — Logic & Memory

Vera Rubin은 7개의 서로 다른 실리콘 제품으로 출하된다 — Nvidia 자체 설계 칩 6개 (Rubin GPU, Vera CPU, NVLink 6 Switch, ConnectX-9, BlueField-4, Spectrum-6) + 새로 라이선스 된 Groq 3 LPU.
Groq 3 LPU (코드네임 LP30)는 Groq 3 LPX 랙 안에 들어간다 — 2026년 3월 체결, ~USD 20B.
모든 칩은 외부 파운드리에서 제조된다.
메모리는 별도의 DRAM 생태계에서 공급된다 — GPU용 HBM4, CPU용 LPDDR5X, switch host용 DDR5, Groq용 on-chip SRAM.

→ naming 규칙: LPU는 Groq 칩 한 개 (Groq 3 LPU = LP30)를 가리키고, LPX는 32 tray에 걸쳐 256개의 LPU를 담는 통합 랙 시스템을 뜻한다. 이 파트 전반에서 두 용어는 서로 바꿔 쓸 수 없다.

Chip 아키텍처 & ISA 계보

플랫폼은 세 가지 ISA 패밀리 — Nvidia GPU, ARM (두 종류), x86 — 와 Groq의 TSP, 그리고 표준 ARM 기반 BMC까지 랙 한 대 안에 포함된다.

랙 안에 Nvidia ARM CPU 두 종이 들어간다 — Vera (새로 도입된 Olympus core, TSMC N3P)와 BlueField-4 (Grace die를 재활용했다).
AMD x86 CPU — Spectrum-X switch host로 쓰인다. switch 관리에 있어 업계가 기본으로 가져가는 선택이다.
삼성에서 만드는 Groq TSP — 오늘날 플랫폼에서 유일한 non-TSMC 실리콘이다 (LP30 / LP35는 SF4X). Feynman 세대의 차세대 LP40에서는 TSMC N3P로 옮겨 간다.
Rubin CPX는 로드맵에서 빠졌다 (GTC 2026). 해당 prefill / decode 워크로드는 이제 Groq 3 LPX Rack이 떠맡는다.
AST2600 (ARM Cortex-A35) — 모든 레퍼런스 SMM 위에 올라가는 BMC. 사실상 업계 표준이다.

Chip별 메모리

칩별 메모리 매핑 — 어떤 종류의 메모리가, 몇 개씩, 어디에서 들어오는지를 정리한다.

HBM4가 플랫폼에서 가장 비싼 메모리이다 — 288 GB × 72 GPU × 18 tray = VR NVL72 랙당 ~20.7 TB HBM4.
LPDDR5X는 플랫폼 내부 구성 수량이 가장 많다 — 랙 수준에서 Vera CPU와 BlueField-4 DPU를 합치면 3.4 TB LPDDR5X에 이른다. Rubin은 2027년에 6B GB 이상의 LPDDR을 소비할 것으로 추정된다 (Apple iPhone과 삼성 스마트폰의 합산 소비량을 넘는다).
Groq의 SRAM-only 설계는 플랫폼에서 가장 큰 메모리 경제학적 분기점이다 — HBM 대역폭을 on-die SRAM (랙당 합쳐서 40 PB/s)으로 대체하고, 외부 DRAM은 아예 쓰지 않는다. 원래 Rubin CPX가 떠맡으려 했던 decode phase를 정조준한다.
SOCAMM2 vs LPCAMM2 — SOCAMM2는 Nvidia가 독점적으로 정의한 서버용 사양, LPCAMM2는 JEDEC의 client/laptop 사양이다. Vera CPU는 Micron의 256 GB "2 TB / CPU" 경로에서도 SOCAMM2만 사용한다. 세 벤더 (하이닉스 / Micron / 삼성) 모두가 Vera Rubin용 SOCAMM2를 공급한다.

Logic 파운드리

용량 현실. 진짜 병목은 logic 공정 wafer가 아니라 CoWoS-L 고급 패키징이다.
Jensen Huang의 발언을 인용하자면: Nvidia는 "Vera Rubin의 전 생애 주기 동안 supply constrained 상태일 것이다".

Node 로드맵

Nvidia는 N2를 건너뛰고 Feynman을 A16 (backside power, 2027 양산)에 맞춰 두었다.
Apple (AAPL)은 A20 / M5용으로 TSMC 2026년 N2 capacity의 50% 이상을 이미 챙겨 둔 상태다.

HBM4 메모리 (Rubin GPU용)

양산 단계의 현실: 초기 Rubin 출하분은 22 TB/s 헤드라인이 아니라 ~20 TB/s 수준에 머물 것으로 보인다. 세 벤더의 2026년 HBM capacity는 hyperscaler·Nvidia와 묶은 다년 Strategic Customer Agreement로 이미 전부 매진된 상태이고, 2026년의 상당 부분에 대한 가격도 2025년 말에 미리 정해졌다.

LPDDR5X (Vera CPU용 — SOCAMM 모듈)

Micron이 Vera의 LPDDR5X 중 ~30%를 가져갔고, 나머지는 삼성과 SK하이닉스가 나눠 가진다. 눈에 띄는 지점은 Micron이 HBM4에서는 사실상 제외되었지만, LPDDR에서는 의미 있는 점유율을 챙겼다는 사실 — LPDDR은 HBM과는 별개로 분류되기 때문이다.

수요 쪽 규모: Rubin은 2027년에 6B GB 이상의 LPDDR 메모리를 소비할 것으로 전망되며 — Apple iPhone과 삼성 스마트폰의 LPDDR 소비를 합친 양보다도 많다.

SOCAMM2 소켓 공급사 — Lotes (3533.TW):

Vera Rubin용 SOCAMM2 소켓 공급사로 확정.
tray당 소요량: Vera CPU 1개당 SOCAMM2 모듈 8개 × CPU 16개 = NVL72 compute tray당 SOCAMM2 모듈 128개.
플랫폼 전체 SOCAMM2 소켓 수요는 8.7M개로 추정.
2027년 Lotes 공급 예상 ~1.6M개 — Foxconn / Quanta / Wistron / Inventec ODM 채널을 통해.
2025 full-year 매출은 AI 서버 connector 수요로 USD 1B를 돌파.
경쟁사 — Amphenol, TE Connectivity, Molex, FIT, BizLink.

TSMC CoWoS-L 용량 할당

Rubin GPU는 TSMC의 9.5-reticle CoWoS-L 패키지를 쓴다. COUPE는 2027년부터 HBM4/4E 12개 통합을 받쳐 준다.

애널리스트 출하 전망: 2026년 Rubin 80만 대 → 2027년 320만 대, ASP ~USD 32K 기준 — 2027년 플랫폼 매출은 ~USD 102B 수준에 닿는다.

대안 플랫폼 구성 — HGX/DGX Rubin NVL8 & Vera CPU Rack

이 파트의 본문은 VR NVL72를 기준으로 쓰여 있지만, 추가적으로 설계된 두 가지 종류의 구성이 실리콘 공급사 폭을 넓혀 준다 — 가장 큰 변화는 x86 host 경로를 통해 Intel이 Rubin 플랫폼 안으로 들어온다는 점이다.

(1) HGX/DGX Rubin NVL8 — x86 host 경로. 8-GPU 서버 레퍼런스 (vs 72-GPU NVL72 랙).

HGX Rubin NVL8 모듈형 GPU 베이스보드 (왼쪽)와 DGX Rubin NVL8 통합 어플라이언스 (오른쪽) — 8-GPU Rubin 서버의 두 form factor

Host CPU: Intel (INTC) Xeon 6 (6700P-Series) — 시스템당 2개 탑재.
Host 메모리: DDR5-6400 RDIMM 32개, 최대 4 TB.
GPU + HBM: NVL72와 동일 — Rubin GPU 8개, HBM4는 동일한 3-공급사 풀에서 공급 (SK하이닉스 선두, 삼성, Micron).
네트워킹 + 스토리지: ConnectX-9, BlueField-4, Micron (MU) PCIe Gen 6 E1.S 모두 그대로 이어진다.

왜 x86인가 / 왜 Intel인가?

소프트웨어 incumbency. AI 프레임워크, 오케스트레이션 스택, 레거시 enterprise 소프트웨어를 ARM (Vera 경로) 위로 옮겨 심으려면 여전히 적지 않은 시간과 노력이 든다. 반면 x86 스택은 당장 오늘부터 출하할 수 있는 상태다.
Brownfield 고객 베이스. Enterprise 데이터센터, telco 인프라, hyperscaler의 레거시 컴퓨트 풀, 전통적인 HPC 고객들은 배포 안정성·OEM 검증·잘 익은 ecosystem·예측 가능한 리드타임을 이유로 Xeon 6를 선호한다.
AMD scarcity at the edge. AMD EPYC는 x86 영역에서 기술적으로 어깨를 나란히 하는 옵션이지만, high-core SKU의 대부분이 hyperscaler 내부 할당에 묶인다 — 그래서 enterprise 규모에서 손에 잡히는 기본 x86 SKU는 Intel이 된다.
CPU:GPU 비율의 변화. Inference와 agentic AI가 비율을 1:8에서 1:1 쪽으로 끌고 가는 흐름 속에서, x86 incumbency의 가치는 오히려 더 올라간다 — 특히 GPU 옆에 붙어 일하는 orchestration·control-plane CPU 영역에서 그렇다.

(2) Vera CPU Rack — standalone. 최대 Vera CPU 256개로 구성되는 별도 랙.

Vera CPU Rack — 완전한 standalone 랙 섀시 (왼쪽), Vera CPU 소켓이 있는 compute tray (가운데), Vera CPU 패키지 디테일 (오른쪽)

메모리: SOCAMM2 전용 — LPCAMM2는 어떤 Nvidia 시스템에서도 쓰이지 않는다. 공급사 매핑은 NVL72 Vera 소켓 (§ 1 Chip별 메모리)과 같다 — SK하이닉스 192 GB (MP 2026년 4월), Micron 192 GB (MP 2026년 3월, 256 GB 샘플 경로로 2 TB / CPU까지 닿는다), 삼성 (2025년 샘플 → 2026년 초 MP).
확정 고객: Oracle (ORCL), CoreWeave (CRWV), Nebius (NBIS), Alibaba (BABA) — 이미 x86 아키텍쳐에 의존하지 않는 greenfield AI-native 진영.
옆에 놓이는 랙: Groq 3 LPX 랙은 일부 inference fleet에서 Vera CPU 랙과 함께 설치되며, SRAM-only LP30 die 위에 더해 Micron (MU)에서 공급받는 랙당 12 TB DDR5를 얹어 간다.

향후 반복 언급될 구성들에 ...

Vera Rubin Decoded Pt. 6 | 공급망 마스터 레퍼런스

Vera Rubin Decoded Pt. 6 | 공급망 마스터 레퍼런스

Vera Rubin Decoded Pt. 5 | 랙 전력과 네트워킹 fabric

Vera Rubin Decoded Pt. 4 | 랙 조립 — 트레이, PCB, 쿨링

Vera Rubin Decoded Pt. 3 | Vera CPU와 네트워킹 실리콘 제품군

Vera Rubin Decoded Pt. 2 | Rubin GPU 엔지니어링 심층 분석

Vera Rubin Decoded Pt. 1 | 플랫폼 개요와 아키텍처 맵

Sub-System Index