1. 내러티브
1-1. AI 인프라의 조연에서 주연으로
NAND가 이제 단순 저장이 아니라 AI 모델 효율을 좌우하는 핵심 요소(KV cache 저장)
CES 2026 청사진
GPU가 계산
DRAM이 단기기억
NAND가 장기기억 + 최적화 -> 사용자 과거 맥락 의도 기억
KV cache(Key-Value Cache)
한번 계산한 결과(중간값)를 저장해 뒀다가 필요할 때 다시 꺼내 쓰는 공간
캐시 데이터 -> HBM 용량으로 감당 못할정도로 커짐
병목 해결을 위해 베라 루빈 아키텍처에 ICMS(Interface Context Memory Storage) 라는 메모리 계층 도입
ICMS(Inference Context Memory Storage - 베라 루빈 아키텍처의 새로운 메모리 계층)
로컬 SSD와 공유 스토리지 사이에 16TB 규모 SSD를 배치해 잘 쓰지 않는 cold data -> warm data 로 빠르게 전환
서버당 낸드 탑재량 폭발적 증가
베라 루빈 시스템 1개당 1152TB 낸드 추가 필요
2027년 베라루빈 서버 출하량 10만대 가정 -> 1억 1520만TB -> 글로벌 낸드 수요 9.3%를 단일 시스템이 집어삼키는 효과
1-2. NAND의 강한 가격 상승 사이클
최소 1~2년간 P위주의 강한 사이클


1-3. 공급이 수요를 따라가지 못하는 NAND(eSSD)
과거 감산과 투자 축소로 인해 공급은 제한된 상태. 단기적으로 기존 라인 개선으로 버티고 중기적으로 2027년 이후 신규 팹으로 대응하는 흐름




불황으로 NAND 투자 큰폭으로 감소된 상황
지난 몇년간 메모리 3사는 HBM과 D램 라인 증설에 올인
팹이 부족한 상황 -> 삼성/하닉/마이크론 -> 디램에 집중, 낸드 투자 여력은 부족
신규 클린룸 -> 디램/낸드 선택을 해야하므로 서로 영향...


![[산업 > 반도체] 파운드리 소부장, 기판/메모리모듈 관련 체크](https://post-image.valley.town/zogGiW9TyUJ0CEhZO_CjS.png)
![[산업 > 반도체] 메모리/GPU Shortage](https://post-image.valley.town/1yOP3dRPdxUgclVrTOPfn.png)
![[산업 > AI 팩토리] 토큰과 AI 팩토리](https://post-image.valley.town/HXkl84sQWbEU10Yq3pSgD.png)