로그인 Valley AI 시작하기시작하기

Valley Space인기

[산업 > 반도체] NAND Cycle

기록하는 공간 산업 > 반도체

[산업 > 반도체] NAND Cycle

밥풀

2026.04.26조회수 153회

1. 내러티브

1-1. AI 인프라의 조연에서 주연으로

NAND가 이제 단순 저장이 아니라 AI 모델 효율을 좌우하는 핵심 요소(KV cache 저장)

CES 2026 청사진
- GPU가 계산
- DRAM이 단기기억
- NAND가 장기기억 + 최적화 -> 사용자 과거 맥락 의도 기억
KV cache(Key-Value Cache)
- 한번 계산한 결과(중간값)를 저장해 뒀다가 필요할 때 다시 꺼내 쓰는 공간
- 캐시 데이터 -> HBM 용량으로 감당 못할정도로 커짐
- 병목 해결을 위해 베라 루빈 아키텍처에 ICMS(Interface Context Memory Storage) 라는 메모리 계층 도입
ICMS(Inference Context Memory Storage - 베라 루빈 아키텍처의 새로운 메모리 계층)
- 로컬 SSD와 공유 스토리지 사이에 16TB 규모 SSD를 배치해 잘 쓰지 않는 cold data -> warm data 로 빠르게 전환
- 서버당 낸드 탑재량 폭발적 증가
  - 베라 루빈 시스템 1개당 1152TB 낸드 추가 필요
  - 2027년 베라루빈 서버 출하량 10만대 가정 -> 1억 1520만TB -> 글로벌 낸드 수요 9.3%를 단일 시스템이 집어삼키는 효과

1-2. NAND의 강한 가격 상승 사이클

최소 1~2년간 P위주의 강한 사이클

1-3. 공급이 수요를 따라가지 못하는 NAND(eSSD)

과거 감산과 투자 축소로 인해 공급은 제한된 상태. 단기적으로 기존 라인 개선으로 버티고 중기적으로 2027년 이후 신규 팹으로 대응하는 흐름

불황으로 NAND 투자 큰폭으로 감소된 상황
- 지난 몇년간 메모리 3사는 HBM과 D램 라인 증설에 올인
팹이 부족한 상황 -> 삼성/하닉/마이크론 -> 디램에 집중, 낸드 투자 여력은 부족
- 신규 클린룸 -> 디램/낸드 선택을 해야하므로 서로 영향...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

이미 계정이 있으신가요?로그인하기

댓글 1개

밥풀

구독자 73명구독중 48명

섹터 공부 열심히 하자

장수범고래

2026.04.30

감사합니다

산업 > 반도체 카테고리의 다른글

[산업 > 반도체] 파운드리 소부장, 기판/메모리모듈 관련 체크

삼성전자, 하이닉스, 키옥시아, 마이크론, ARM, 인텔, 브로드컴 - 이익대비 밸류에이션 오히려 덜 부담 반도체 소부장 - 밸류에이션 부담? 지속적으로 체크해보기. 기판정도는 들고가는것도? 1. 파운드리 내러티브 삼성 파운드리 적자가 줄어들고 있음 만약에 5천억 적자로 줄어들면 -> 주가에 유의미한 영향 가능 내년에 흑자가 된다고 보는 느낌. 마진이 5% 정도 -> 삼성전자 5~7% 밸류에이션 플러스 효과 종목 $두산테스나 (OSAT) Groq LPU 4나노 담당 - 기판은 삼성전기 $네패스아크 , $네패스 (테스트 쪽에서 받음) 를 통해서 두산테스나 정보를 간접적으로 얻을 수 있음. $하나마이크론 (OSAT) 한국,베트남,브라질 3대 거점을 가진 글로벌 OSAT $에스앤에스텍 (Blank Mask) 3분기부터 블랭크 마스크 EUV $원익IPS 삼성 파운드리 국산화 핵심 파트너 3D NAND, DRAM 공정 기술 삼성과 공동 개발 (강력한 파트너십) 14nm FinFET 공정부터 삼성전자 파운드리 장비 국산화에 참여 다양한 증착 장비(CVD, ALD) 포트폴리오 보유 디자인하우스 - 삼성전자 DSP 4개 업체 - 2나노가 핵심 $세미파이브 - 저력 있긴함. 2. 기판 내러티브 GPU -> HBM -> DRAM -> NAND -> CPU -> 다시 GPU 쇼티지 AI 팩토리 -> 기판 수요 증가, 기판 쇼티지 CPU 쇼티지 ->...

산업 > 반도체

[산업 > 반도체] 파운드리 소부장, 기판/메모리모듈 관련 체크

[산업 > 소부장] 파운드리, 기판/메모리모듈 관련 체크

삼성전자, 하이닉스, 키옥시아, 마이크론, ARM, 인텔, 브로드컴 - 이익대비 밸류에이션 오히려 덜 부담 반도체 소부장 - 밸류에이션 부담? 지속적으로 체크해보기. 기판정도는 들고가는것도? 1. 파운드리 내러티브 삼성 파운드리 적자가 줄어들고 있음 만약에 5천억 적자로 줄어들면 -> 주가에 유의미한 영향 가능 내년에 흑자가 된다고 보는 느낌. 마진이 5% 정도 -> 삼성전자 5~7% 밸류에이션 플러스 효과 종목 $두산테스나 (OSAT) Groq LPU 4나노 담당 - 기판은 삼성전기 $네패스아크 , $네패스 (테스트 쪽에서 받음) 를 통해서 두산테스나 정보를 간접적으로 얻을 수 있음. $에스앤에스텍 (Blank Mask) 3분기부터 블랭크 마스크 EUV 디자인하우스 - 삼성전자 DSP 4개 업체 - 2나노가 핵심 $세미파이브 - 저력 있음 2. 기판 내러티브 GPU -> HBM -> DRAM -> NAND -> CPU -> 다시 GPU 쇼티지 AI 팩토리 -> 기판 수요 증가, 기판 쇼티지 CPU 쇼티지 -> 어느정도 구조적 CPU -> KV 캐시 -> CPU 옆에있는 SOCAMM 수요가 좋아짐. SOCAMM에 들어가는 기판업체가 직접적인 수혜주 -> $코리아써키트 같은 SOCAMM 비중이 아직은 매출에서 적음(5% 안됨), $심텍 , $티엘비 다 한자리 내년에 ...

산업 > 반도체

[산업 > 소부장] 파운드리, 기판/메모리모듈 관련 체크

삼성전자, 하이닉스, 키옥시아, 마이크론, ARM, 인텔, 브로드컴 - 이익대비 밸류에이션 오히려 덜 부담 반도체 소부장 - 밸류에이션 부담? 지속적으로 체크해보기. 기판정도는 들고가는것도? 1. 파운드리 내러티브 삼성 파운드리 적자가 줄어들고 있음 만약에 5천억 적자로 줄어들면 -> 주가에 유의미한 영향 가능 내년에 흑자가 된다고 보는 느낌. 마진이 5% 정도 -> 삼성전자 5~7% 밸류에이션 플러스 효과 종목 $두산테스나 (OSAT) Groq LPU 4나노 담당 - 기판은 삼성전기 $네패스아크 , $네패스 (테스트 쪽에서 받음) 를 통해서 두산테스나 정보를 간접적으로 얻을 수 있음. $에스앤에스텍 (Blank Mask) 3분기부터 블랭크 마스크 EUV 디자인하우스 - 삼성전자 DSP 4개 업체 - 2나노가 핵심 $세미파이브 - 저력 있음 2. 기판 내러티브 GPU -> HBM -> DRAM -> NAND -> CPU -> 다시 GPU 쇼티지 AI 팩토리 -> 기판 수요 증가, 기판 쇼티지 CPU 쇼티지 -> 어느정도 구조적 CPU -> KV 캐시 -> CPU 옆에있는 SOCAMM 수요가 좋아짐. SOCAMM에 들어가는 기판업체가 직접적인 수혜주 -> $코리아써키트 같은 SOCAMM 비중이 아직은 매출에서 적음(5% 안됨), $심텍 , $티엘비 다 한자리 내년에 ...

산업 > 반도체

[산업 > 반도체] 메모리/GPU Shortage

1. [26.03.13] The Great AI Silicon Shortage AI 컴퓨트 부족의 병목이 ‘패키징(CoWoS)’에서 ‘실리콘(최첨단 로직 웨이퍼 + HBM 메모리)’로 옮겨갔다 글의 핵심 주장 토큰 수요가 폭증하면서(에이전틱 워크플로우/코딩 에이전트 같은 사용 확대) GPU/클러스터를 “원하는 만큼” 빌리거나 사기 어려운 상태가 지속된다고 봅니다. 그래서 하이퍼스케일러들은 CAPEX(특히 데이터센터·서버)를 더 쓰고 싶어도, 결국 ‘칩을 만들 실리콘’이 부족해서 배치 속도가 제한된다는 논리예요. 과거엔 CoWoS, 데이터센터 전력 같은 제약이 더 크게 보였지만, 지금 국면은 “실리콘 쇼티지(wafer + memory)”로 규정합니다. 1) 가장 큰 병목: TSMC N3(3nm) 로직 웨이퍼 2023년부터 N3 계열이 양산되었고, 초반엔 스마트폰/PC 고객이 주 수요(Apple, Qualcomm, MediaTek, Intel 등). 그런데 2026년 전후로 AI 가속기 세대들이 동시다발적으로 N3로 수렴한다고 봐요. (예: NVIDIA 차세대, AMD, Google TPU, AWS Trainium, Meta MTIA 등) 이 “동시 수렴”이 N3 수요 쇼크를 만들었고, TSMC 증설이 그 속도를 못 따라가면서 할당 싸움(누가 웨이퍼를 더 가져가느냐)이 심해진다는 관점입니다. 글에서는 AI 관련 수요가 2026년엔 N3 생산의 약 60%, 2027년엔 약 86%까지 갈 수 있다는 식의 프레이밍을 제시해요. (스마트폰/PC는 상대적으로 밀려나거나 N2로 더 빨리 넘어가게 될 수 있다) 2) 로직만으로는 안 끝남: HBM/DRAM도 같이 막힌다 로직 웨이퍼를 더 받아도, 가속기 생산은 HBM 공급이 따라줘야 합니다. 글의 논지는 대략 이래요: HBM이 DRAM 웨이퍼 용량을 “빨아먹는” 구조라서(wafer-per-bit 기준 HBM이 훨씬 비효율) commodity DRAM을 crowd-out 한다 세대가 갈수록 가속기 당 HBM 탑재량이 크게 증가(Blackwell→Rubin 등)하면서, “유닛 수”보다 “디바이스당 메모리”가 공급을 더 압박한다 HBM4로 갈수록 핀 스피드/수율 난이도가 올라가서 “명목 캐파”와 “유효 캐파”가 벌어질 수 있다 3) 결과적으로 ...

산업 > 반도체

[산업 > AI 팩토리] 토큰과 AI 팩토리

1. 토큰 LLM에서 토큰(token)은 텍스트를 쪼갠 단위. “얼마나 많은 토큰을, 얼마나 싸게, 얼마나 빠르게” 생산/서빙하느냐가 핵심 KPI “$ / 1M tokens(토큰당 비용)이 내려가고 있나?” “tokens/sec per GPU(GPU당 처리량)가 올라가고 있나?” “피크 트래픽 때도 지연시간(SLA)을 지키나?” 젠슨황 - 추론의 시대가 왔다 도구를 사용하는 단계로 진화 AI시대의 화폐 = 토큰 토큰을 대량으로 값싸게 만드는 것이 경쟁력 -> 전력, 메모리 openrouter로 집계되는 ai agent 들의 token 사용량 https://openrouter.ai/rankings 2. AI 팩토리 AI 팩토리 = 토큰을 찍어내는 ‘설비(자본+운영체계)’ 토큰 원가 = (컴퓨팅 비용 + 메모리/대역폭 비용 + 전력/냉각 + 운영 오버헤드) / 생산 토큰 수 토큰 원가 하락 속도 vs 토큰 수요 증가 속도 구성 원재료: 데이터(프롬프트/문서/로그) 생산설비: GPU/TPU + 네트워크 + 메모리(HBM/VRAM) + 스토리지 + 전력/냉각 공정관리(MLOps/LLMOps): ...

산업 > 반도체

32

[산업 > 소부장] 파운드리, 기판/메모리모듈 관련 체크

32

[산업 > 소부장] 파운드리, 기판/메모리모듈 관련 체크

122

[산업 > 반도체] 메모리/GPU Shortage

134

[산업 > AI 팩토리] 토큰과 AI 팩토리