deepseek에 대한 AI연구자와 월스트릿의 생각 차이




DeepSeek-R1 출시는 chatGPT 만큼 큰 관심을 불러일으키고 있습니다. 어쩌면 정말로 큰 변화 일 수 있습니다. 다만 다수의 AI 연구자들은 이를 '당연한 일'로 받아들입니다. (이러한 생각차이는 투자 기회가 될 수도 있습니다.)
이들이 한 일은 o1을 효율적으로 재현하는 '엔지니어링' 입니다. 대체로 OpenAI 정형원 연구원의 MIT 강의에 나온 아이디어를 구현한 것이고, 언젠가 다른 기업들도 할 일입니다. o1과 같은 '프론티어' 모델이 없다면 Knowledge Distillation도 사용할 수 없습니다. 모든 분야가 그렇습니다만 (한국, 중국이 지난 수십년간 증명하였듯) 이미 누군가 이룬 것을 따라가는 과정에서 기술의 효율은 급격하게 상승합니다.
아래 명제에 대해 반박을 하는 AI 연구자는 한 명도 없을 겁니다.
알고리즘의 효율과 성능은 계속 계선되어 왔다.
인간의 편향이 적어질수록 모델의 성능은 향상된다.
컴퓨팅이 커질수록 모델의 성능은 좋아진다.
1, 2를 볼 때 DeepSeek은 지금까지 있었던 일과 다르지 않습니다. 그저 DeepSeek이 중국 기업이라는 점만 다릅니다. (이것이 불러올 정치적 리스크는 걱정이 됩니다.)
3이 계속 옳다면, 스케일링의 법칙은 계속 됩니다.

<테슬라 ...



그런데 단언컨데, 역사상 단 한번도 그런 일은 일어나지 않았습니다. 사람의 탐욕은 '이만하면 충분해'가 없습니다. 새로운 알고리즘을 '레버리지'로 더 좋은 모델을 만드는 경쟁이 시작 될 뿐입니다. 이 문장이 인상깊습니다. 인사이트 나눠주시는 점 늘 감사드립니다. 많은 도움이 됩니다.

감사히 잘 읽었습니다.