
*GPT, Gemini의 답변 내용을 복붙한 글입니다.
딥시크(DeepSeek)가 발표한 이번 논문(n-gram/en-gram 기술)의 핵심 내용은 다음과 같이 요약할 수 있습니다.
기존의 트랜스포머 기반 AI 모델은 다음 단어를 생성할 때마다 GPU를 풀가동해 복잡한 행렬 연산을 수행합니다. 딥시크는 '알렉산더 더 그레이트'나 '유나이티드 스테이츠'처럼 자주 함께 쓰이는 고정된 패턴(n-gram)은 굳이 매번 계산할 필요가 없다는 점에 착안했습니다.
정적 영역 저장: 고유명사, 관용구 등 반복되는 패턴들을 DRAM(메모리)에 미리 저장해 둡니다.
해시(Hash) 함수 활용: 입력된 단어들을 해싱하여 메모리 주소로 바로 변환, 복잡한 연산 없이 DRAM에서 정답 후보를 즉시 꺼내옵니다.
하이브리드 구조: 연산이 필요한 복잡한 추론은 GPU가 담당하고, 뻔한 패턴은 DRAM에서 가져오는 방식을 결합하여 효율을 극대화했습니다.
메모리=지능: 모델의 파라미터(매개변수)를 키우는 것뿐만 아니라, DRAM 용량을 늘리는 것만으로도 모델의 성능(정확도)이 지속적으로 향상된다는 것을 실험으로 입증했습니다.
DRAM 가성비: 수천만 원짜리 GPU를 추가하는 것보다 상대적으로 저렴한 DRAM을 추가해 성능을 올릴 수 있는 '새로운 스케일링 축'을 제시한 것입니다.
연산 효율성: GPU의 연산 부담을 줄여주어 레이턴시(지연 시간)가 개선되고, 더 많은 유저를 동시에 처리할 수 있습니다.
하드웨어 변화: HBM(고대역폭 메모리)뿐만 아니라 일반 DRAM(DDR5, LPDDR 등)의 중요성이 비약적으로 커지며, 대용량 메모리를 연결하는 CXL 기술이 다시 핵심으로 떠오를 전망입니다.
한 줄 요약: "자주 쓰는 데이터 패턴을 DRAM에 저장해 두고 바로 꺼내 쓰는 방식을 도입함으로써, 메모리 용량만 늘려도 AI 성능이 비약적으로 좋아진다는 점을 증명한 논문"입니다.
딥시크가 최근 공개한 '엔그램(n-gram)' 기술은 AI 모델의 연산 효율을 극대화하기 위해 DRAM을 일종의 '기억 저장소(Lookup Table)'로 활용하는 혁신적인 방식입니다. [07:43]
DRAM 수요의 폭발적 증가 가능성: 기존에는 모든 단어 생성 과정을 GPU와 HBM(고대역폭 메모리)을 통한 복잡한 연산에 의존했습니다. 하지만 딥시크의 방식은 자주 반복되는 고정 패턴(예: 고유명사, 관용구 등)을 DRAM에 저장해 두었다가 필요할 때 바로 꺼내 쓰는 방식을 취합니다. [08:15]
새로운 스케일링 법칙: 딥시크는 DRAM 용량을 늘릴수록 AI의 성능(로스 감소)이 지속적으로 좋아진다는 점을 증명했습니다. [10:45] 이는 단순히 GPU를 늘리는 것보다 DRAM을 추가하는 것이 성능 개선에 매우 효과적임을 의미하며, 서버당 필요한 DRAM 용량이 수백 GB 단위로 커질 수 있음을 시사합니다. [12:49
![[GPT] 중국 AI 관련 ETF 2개 비교 요약](https://post-image.valley.town/2ReuWVVbnM8fN3xepm_Ei.png)
![[GPT] XLV(헬스케어ETF) 요약](https://post-image.valley.town/kVxi5m6qx9Mbf9PrRMyVb.png)