[단상(斷想)] #1. DeepSeek, 메기가 될 상(像)인가?

[단상(斷想)] #1. DeepSeek, 메기가 될 상(像)인가?

avatar
ValleyHills
2025.02.15조회수 5회

지난 설날 연휴(25.1.27~1.30) Global Issue Rising "DeepSeek"를 보면서, 개인적으로 당시에 보고 듣고 느꼈던 사항을 정리(2.1)한 내용입니다. 벌써 보름 前 글이라서, AI 생태계의 변화무쌍을 감안하면 일정 부분 시의성이 떨어진 부분도 있을 수 있지만 큰 맥락은 유지되는 듯해서 공유해 보고자 합니다. <DeepSeek, 메기가 될 상(像)인가?>


1) 2025.1.20 추론 모델 'DeepSeek R1'이 세상에 오픈되면서 곧장 가성비와 AI 컴퓨팅 H/W 경쟁의 유의미 논쟁에 불을 지폈습니다. 그리고, DeepSeek 진화 속도에 대해서도 새삼 주목받습니다. 2023.11.29 첫 버전을 출시한 후, 2024.5.6 v2, 2024.12.26 v3 오픈 후, 2025.1.20 v3 기반 2가지 메인 모델(R1, R1-Zero)과 오픈 소스 모델에 R1을 통해 생성한 데이터셋으로 fining-tuning 오픈 소스 기반의 6가지 "증류 모델"을 공개합니다.

※ 지식 증류(Knowledge Distillation) 방식 : 증류 기법은 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용, 유사한 기능을 개발하는 것. 걸러진 결과물을 학습하므로 이전과 같은 고비용 투자를 하지 않아도 돼 효율성이 높음.

2) 'DeepSeek R1'은 다양한 곳의 성능 벤치마크 결과들에서 ChatGPT-4o(Open AI), LLaMA-3(메타) 및 Gemini 2(구글)를 능가함을 보여주고 있으며, 해외 경험이 없는 중국 토종 창업자 량원핑(梁文锋,1985년生,浙江大)에 대한 관심도 떠오르고 있습니다. 그는 자산 12조원이 넘는 중국 토종 퀀트 헤지펀드(High Flyer)의 공동 창업자이기도 합니다.

3) Rizing super star에게 따라붙는 부러움과 시기 ...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

이미 계정이 있으신가요?로그인하기
댓글 0
avatar
ValleyHills
구독자 9명구독중 4명
언어 너머의 삶을 언어 이상의 표현으로 감당해 내는 그 날을 향하여 !!!