새로운 스케일링의 축 : 메모리





최근 DeepSeek에서 발표(2026.01.12)한 논문 "Conditional Memory via Scalable Lookup"은 AI 모델의 스케일링의 새로운 축을 제안하고 있으며, 특히 현재 시장의 DRAM 공급 부족(Shortage) 현상을 설명하는 중요한 단서가 됩니다.
새로운 스케일링 축의 등장 (Compute → Memory):
기존에는 파라미터 수와 연산량을 늘리는 것이 성능 향상의 핵심 축이었습니다. (Pre-train & Test-time scaling)
본 논문은 '메모리(Memory)'를 새로운 확장의 축으로 제시합니다. 이는 연산 자원을 낭비하며 지식을 '추론'하는 대신, 외부 메모리에서 정답을 즉시 찾아오는 방식(O(1) Lookup)으로 패러다임을 전환한 것입니다.
마치 경험이 쌓이면 대부분의 상황에서 굳이 고민하지 않고 업무를 처리할 수 있듯 매번 고민해서 문제를 푸는 것이 아니라 자주 나오는 패턴은 기억해두는 것이 핵심입니다.
DRAM 쇼티지의 기술적 배경:
구글의 선행 연구를 바탕으로 DeepSeek이 이를 오픈소스로 공개했다는 점은, 이미 구글을 포함한 빅테크 기업들이 내부적으로 이 기술을 표준으로 채택하여 운용 중임을 시사합니다.
이 기술은 GPU VRAM뿐만 아니라 방대한 양의 일반 DRAM(CPU 메모리)을 적극적으로 활용합니다. 최근 시장에서 관측되는 이례적인 DRAM 쇼티지(공급 부족)는 이러한 '메모리 중심 아키텍처' 로의 전환에 따른 서버 D램 수요 폭증이 주요 원인일 가능성이 높습니다.



![[Deep Dive Tech] DeepSeek-R1 분석](https://arxiv.org/html/2501.12948v1/x1.png)