Engram과 메모리 수요

개요

Deepseek는 Engram이란 LLM 성능 향상 방법을 논문으로 발표함. 필요할 때 일부 정보를 조건부 메모리(필요할 때만 조회해 쓰는 메모리)에서 꺼내 쓰는 방식으로 모든 단어를 연산하는 기존 방식에 비해 연산 부담이 감소하게 됨. 이렇게 절약된 자원을 추론에 활용하는 것으로 LLM 성능을 향상 시킬 수 있게 됨

관련 영상) DeepSeek AI 신규 기술... DRAM 대폭 늘리면 성능 더 좋아진다

Engram

관용 어구처럼 함께 조합해서 사용하는 단어는 아주 높은 확률로 함께 쓰임
LLM은 이런 확률 높은 조합도 매번 연산해서 출력함
DeepSeek는 구글 검색창에서 입력 중인 단어 다음에 올 단어가 무엇일지 예상하는 N-gram 아이디어를 활용해, 확률이 높은 단어 조합을 테이블로 저장해 메모리에 올려두고 활용하는 Engram 방식을 제안함
이 테이블을 ...

Engram과 메모리 수요

Engram과 메모리 수요

MoE 아키텍처와 비용 감소

트럼프는 왜 이렇게 밀레이를 좋아할까?

업보 쌓기는 새 유행이 될 것인가 (Feat. 아르헨티나, 일본, 프랑스)

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

MoE 아키텍처와 비용 감소

트럼프는 왜 이렇게 밀레이를 좋아할까?

업보 쌓기는 새 유행이 될 것인가 (Feat. 아르헨티나, 일본, 프랑스)

Engram과 메모리 수요

Engram과 메모리 수요

MoE 아키텍처와 비용 감소

트럼프는 왜 이렇게 밀레이를 좋아할까?

업보 쌓기는 새 유행이 될 것인가 (Feat. 아르헨티나, 일본, 프랑스)

회원가입만 해도이 글을 무료로 읽을 수 있어요.

MoE 아키텍처와 비용 감소

트럼프는 왜 이렇게 밀레이를 좋아할까?

업보 쌓기는 새 유행이 될 것인가 (Feat. 아르헨티나, 일본, 프랑스)

회원가입만 해도
이 글을 무료로 읽을 수 있어요.