AI모델의 수학 문제 풀이 점수라고 하는데, 우리나라 모델들의 퍼포먼스가 빅테크 모델 대비 매우 처참하네요. 심지어 딥시크는 빅테크도 아닌데 말이죠...
(수학 문제 구성 : 총 50문제 > 한국 수능 수학 중 난이도 높은 20문제 / 한국 대학 논술 10문제 / 인도 대학 입시 10문제 / 일본 도쿄대 공과대학 대학원 입시 10문제)
게다가 NC는 라마 어쩌구라고 되어있는데, 그러면 독자 모델도 아니고 메타의 오픈소스 모델을 기반으로 튜닝한 것으로 보이구요. 사명에서 soft를 뗀다 만다 하고 있을 때가 아닌 것 같네요.





