2022년 11월 ChatGPT 3.5의 등장은 세계를 놀라게 했고, 인공지능의 발전 속도에 날개를 달아주었다.
불과 2년이 조금 지나, 최근 DeepSeek는 강화학습(Reinforcement Learning)을 통해
인간의 개입을 최소화한 인공지능 모델의 학습 방식을 보여주었다.
ChatGPT o3는 특정 분야에 전문화된 모델(Domain-Specific Model)보다
대규모 강화학습을 통해 모든 분야를 고루 학습시켜야 특정 분야도 더 잘할 수 있다는 것을 보여주었으며,
그 모델이 코딩(IOI), 추론(ARC-AGI) 등 모든 분야에서 인간을 압도하는 수준을 보이고 있다.
그렇다면 인간의 개입 없이 모든 분야에 뛰어난 인공지능 모델을 만들고,
그 모델을 활용해서 더 나은 모델을 만들고,
그 더 나은 모델을 활용해서...
회원가입만 해도
이 글을 무료로 읽을 수 있어요.
이미 계정이 있으신가요?로그인하기
