Marcel의 톡 | Valley AI

Marcel

2025.12.16

AI모델의 수학 문제 풀이 점수라고 하는데, 우리나라 모델들의 퍼포먼스가 빅테크 모델 대비 매우 처참하네요. 심지어 딥시크는 빅테크도 아닌데 말이죠...

(수학 문제 구성 : 총 50문제 > 한국 수능 수학 중 난이도 높은 20문제 / 한국 대학 논술 10문제 / 인도 대학 입시 10문제 / 일본 도쿄대 공과대학 대학원 입시 10문제)

게다가 NC는 라마 어쩌구라고 되어있는데, 그러면 독자 모델도 아니고 메타의 오픈소스 모델을 기반으로 튜닝한 것으로 보이구요. 사명에서 soft를 뗀다 만다 하고 있을 때가 아닌 것 같네요.

댓글 7개

작태

2025.12.16

관련 업종에 있다보니 말씀드리면,

이게 하이퍼 스케일러와는 가용 자원에 큰 차이가 있다 보니..

외부의 모든 벤치마크 경쟁에서 이기기기보다, 모델 효율화에 좀 집중하고 있는 타이밍이긴 합니다

최고의 답을 제공하는 것보다 보편적 AI 제공에 노력하는 편이 있는데요.

대화형 AI는 아예 UI도 빼버리고 포기하고,

웬만해서는 리스크 없이 적절하게 만족도 줄 수 있는 추천만 제공하거나,

아니면 가능한 질의에만 자사 AI 사용하는 식으로요.

국내 소프트웨어는 LLM 스케일업 경쟁으로 다가가기 보다,

"그래도 이 정도는 우리가 AI로 더 잘 할 수 있지 않을까?" 하는 버티컬 패러다임으로 넘어 갔다고 봐야 할 것 같습니다.

Marcel

작성자

2025.12.16

사실 기사다보니 어그로성이 조금 있겠다 싶기는 했습니다...ㅎㅎ

"우리는 GPU 엄청 적은데 그래도 이정도는 해!"의 방향으로 생각하는게 현실적으로도, 향후 미래 가능성의 측면에서도 더 좋은 방향이겠군요. 현업의 관점에서 말씀해주셔서 감사드립니다!

몽상과 사색

2025.12.16

견해 공유 감사드립니다!

울산바운스

2025.12.16

이건 좀 심각하네요..

몽상과 사색

2025.12.16

규모의 경쟁에서 쉽지 않나 보네요 ㅠㅠ 개인적으로 양자쪽이든 AI쪽이든 반도체 소부장 느낌으로다가 가는게 맞다고 저는 봅니다.

NV사랑DA

2025.12.16

연구원들의 실력문제보다 먼저 생각할게 gpu 갯수가 아닐까싶습니다

(수정됨)

Marcel

작성자

2025.12.16

그쵸 아무래도ㅎㅎ 위 댓글에서 이야기했듯이 기사이기 때문에 어그로가 다소 있는 것 같습니다. 그 관점에서 보면 업스테이지는 대단한 회사네요. 우리나라에 GPU 좀 더 주십시오 젠슨형님...