로그인 Valley AI 시작하기시작하기

Valley Space인기

(유출) DeepSeek V4 벤치마크 결과

하루를 꾸준히 쌓기 메모

(유출) DeepSeek V4 벤치마크 결과

하루공부

2026.02.16조회수 283회

https://artofproblemsolving.com/wiki/index.php?title=2026_AIME_I_Problems
https://x.com/i/status/2023113913856901263

DeepSeek V4 벤치마크 결과가 유출되었습니다.

SWE-Bench Verified에서 83.7%의 정확도를 기록했습니다.

이는 세계 최고의 코딩 모델이 될 가능성이 높습니다.

참고로, 다른 모델들의 결과는 다음과 같습니다.

DeepSeek V3.2 Thinking: 73.1%

GPT 5.2 High: 80.0%

Kimi K2.5 Thinking: 76.8%

Gemini 3.0 Pro: 76.2%

코딩뿐만이 아닙니다.

다른 벤치마크 결과도 확인해 보세요.

AIME 2026: 99.4%

FrontierMath Tier 4: 23.5% (GPT 5.2보다 11배 우수)

IMO Answer Bench: 88.4%

이 수치들이 사실이라면, DeepSeek V4는 컴퓨터 알고리즘 순위를 완전히 뒤바꿀 것입니다.

중국 연구소들은 속도를 늦추는 것이 아니라 오히려 가속화하고 있습니다.

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

7일 무료 체험 시작하기

이미 계정이 있으신가요?로그인하기

댓글 5개

하루공부

구독자 268명구독중 42명

성장 아카이브 (오류 지적은 항상 감사하게 생각합니다) * 루틴 & 다수시행 **적절한 자기통제 비대칭성 펀더멘털 (퀄리티 ↔ 성장) Valuation Multiple ***정성적인 알파 추정 추세추종 시장의 효율성 ****복리 효과와 시간지평

taylor

2026.02.16

결국 제조업과 ai 모두 중국의 승리로...?

하루공부

작성자

2026.02.16

우선 유출 자료라서 오늘 새벽 발표를 잘 봐야할 것 같습니다!!

Bewizard

2026.02.16

이젠 좀 올라라 중국 주식들아 ㅠㅠ

하루공부

작성자

2026.02.16

우선 유출 자료라서 오늘 새벽 발표를 잘 봐야할 것 같습니다!!

투기꾼침팬빌런

2026.02.16

중국은 그래픽 카드 자원이 부족할텐데... 역시 정보의 우위로 이겨 나가는 가 보네요. 살아남을 기업이 무엇인지 다시 생각해볼 단계 같습니다. 제 2차 딥씨크 충격이 올지도 모르겠네요.

메모 카테고리의 다른글

2월 17일 Deepseek v4 출시 예정

다음 주 LLM 업데이트가 예정되어 있습니다. Sonnet 5 Deepseek v4 ChatGPT-5.3 몇몇 X 및 Reddit 유저들은 DeepSeek V4 출시를 크게 기대하는 모습입니다. 2025년 말까지만 하여도, 딥시크 v3.1 출시는 부족한 컴퓨팅파워로 인하여 v4출시하지 못했던 차선작이라는 평가를 받습니다. V4는 이를 바탕으로 컴퓨팅 효율성을 강화한 모델이라는 평가가 지배적입니다. Reddit, GitHub, Medium 등 개발자 커뮤니티와 IT 매체들을 통해 V4의 아키텍처(Engram memory 등) 및 내부 벤치마크 점수가 유출되어 확산되었습니다. 유출된 내부 테스트 소문에 따르면, 코딩 능력을 평가하는 HumanEval 벤치마크에서 90% 수준의 정확도를 기록한 것으로 알려졌습니다. 이는 최근 Claude 모델(~88%)과 GPT-4 계열(82~90%)을 뛰어넘는 수치로 주장됩니다. 실제 GitHub의 복잡한 이슈를 해결하는 SWE-Bench에서도 현재 최고 수준인 Claude Opus 4.5 (80.9%)와 경쟁하거나 초과할 가능성이 소문으로 퍼지고 있습니다. 설 연휴지만, 트래킹이 필요해 보입니다. DeepSeek V4 출시일은 월요일(2월 17일경)로 보이는 소문이 많습니다.

2월 17일 Deepseek v4 출시 예정

'26년 2월 5일, 스테이블코인에 대한 생각

현재 미국 금융권과 암호화폐 업계 간에는 스테이블코인 이자 또는 보상에 문제로 다투고 있다. 핵심 갈등: 이자인가? 보상인가? 이 논쟁의 핵심은 스테이블코인을 보유한 고객에게 주는 돈의 성격을 무엇으로 규정하느냐 은행권의 주장 무허가 예금은 안 된다. 돈을 맡기고 이율을 받는다면 그것은 실질적인 예금이다. 그런데 코인베이스나 서클은 은행 라이선스도 없고, 예금보험료도 내지 않으면서 고금리(3.5% 등)를 줘서 은행의 예금을 빼앗아 가고 있다. 암호화폐 기업 주장 우리는 이자를 제공하는 것이 아니라 보상이다. 이것은 은행 이자가 아니다. 카드사가 포인트를 주거나, 우버가 우버 캐시를 주는 것과 같은 고객 로열티 보상이다. 기술 기업이 자사 서비스를 이용하는 고객에게 혜택을 주는 것을 막아서는 안 된다. 2025년에 통과한 '지니어스 법(GENIUS Act)' 내용을 살펴보면 스테이블코인 발행사(서클 등)는 반드시 1:1로 달러 현금이나 미국 국채를 준비금으로 보유해야 한다 스테이블코인 발행사는 고객에게 직접 이자를 지급할 수 없다 지니어스 법이 규정한 3대 필수 고지 사항은 3가지가 있다. 예금자 보호가 되지 않는다 (No FDIC Insurance) 투자 자산(증권)이 아니다 (Not a Security/Investment) 법정화폐가 아니다 (Not Legal Tender) 지니어스 법(GENIUS Act)을 통해, 스테이블코인은 투자자산과 예금 사이의 중간 성격임을 알 수 있었다. 그럼에도 코인기업들은 고객이게 이자를 공유할 수 있는 방법을 찾았다. 그 방법론을 3단계로 설명하면 다음과 같다. 1단계: 코인 구매 고객이 1억 원어치 ...

CPO 발전 흐름, 그리고 CPO와 LPO 차이점

1. CPO란? CPO(Co-Packaged Optics)란? 한국말로 직역하자면 '공동 패키지 광학??'이라고 할 수 있습니다. 현재 시장에서 CPO는 데이터 센터 내 고성능 스위치, 또는 GPU 및 CPU와 같은 연산 칩 바로 옆에 광학 엔진(Optical Engine)을 하나의 패키지로 묶는 기술을 말합니다. 기존 데이터 센터 내부는 전기 신호를 빛의 형태로 바꿔 빠르게 주고 받았습니다. CPO는 이러한 데이터 흐름을 빛의 형태로 더 빠르게 주고받기 위해 만들어진 차세대 반도체 패키징 기술을 말합니다. 2. CPO 등장 배경 위 이미지는 2024년에 네트워크 속도의 발전을 예측한 그래프입니다. 한편 현재 데이터 센터 내의 네트워크 속도는 1.6T(8X200G)까지 기술 진보가 빠르게 진행되고 있습니다. 이와 관련된 대표적인 기업은 바로 $AVGO $MRVL 입니다. 두 기업의 200G serDes 기술의 안착을 생각보다 빨랐는데요. 그 결과 200G/lane DSP가 이미 양산 단계에 접어들었고, 1.6T 시대를 맞이할 수 있게 되었습니다. 한편으로 3.2T-XD (16x200G)는 현재 연구실 단계를 넘어 시제품(Prototype) 및 초기 검증 단계에 있습니다. 이를 미뤄볼 때, CPO 기술의 도입이 예상보다 빠르게 검토되고 있습니다. 그렇다면 네트워크 속도의 증가와 CPO는 어떤 연관성이 있을까요? 기존에는 광모듈과 칩들이 따로따로 있었습니다. 즉, 전기 신호를 빛으로 전환하는 장치가 연산 칩과 멀리 떨어져 배치된 구조였습니다. 이로 인해 두 부품 사이를 PCB 위의 구리 배선으로 연결해야만 했습니다. 문제는 데이터 전송 속도가 고속화될수록 발생합니다. 전기 신호가 구리 배선을 통과할 때 발생하는 신호 감쇄와 왜곡이 심해지기 때문입니다. 이를 보정하기 위해 더 많은 전력을 소모하여 신호를 증폭시켜야 하며, 이는 곧 막대한 에너지 소비와 발열 문제로 직결됩니다. CPO는 이러한 물리적 거리를 극대화로 줄여 전력 효율을 개선하고 신호 손실을 최소화하는 차세대 솔루션입니다. 현재 기술은 1.6T까지 발전했고, 곧 3.2T에 도달할 것으로 예상되면서 전력 소모 문제는 더욱 두드러졌습니다. CPO의 초기에서는 상당한 전력 절감 효과를 보여주었으며, 이는 플러그형 광모듈 대비 최대 4배의 에너지 효율을 보였습니다. 향후 1.6Tbps, 3.2Tbps 이상의 네트워킹 아키텍처에 CPO 도입은 필수적이며, 그 중요성은 더욱 중요해질 것으로 보입니다. 3. CPO 혁신 순서 3.1. 먼저 전력 장벽이라는 한계에 부딪힌 이너넷 스위치 위 사진은 AI 데이터 센터 붐이 본격화되기 전, 클라우드 서비스를 위해 설계된 현대적인 이더넷 스위치입니다. 2010년대 후반부터 널리 사용된 이 장비들은 전통적인 플러그형(Pluggable) 광모듈 방식입니다. 하지만 이러한 네트워크 구조는 곧 '물리적 한계'에 직면하게 됩니다. 그 주요 문제는 3가지입니다. 첫째, 당시 찾아온 102.4Tbps 시대에는 800G 모듈 128개가 필요했습니다. 그래서 위 사진과 같은 광모듈을 꽂아야합니다. 그런데 문제가 발생합니다. 표준 규격 스위치의 전면에는 128개만큼의 모듈을 꽂을 물리적 공간이 절대적으로 부족합니다. 둘째, 스위치는 겉보기에 단순한 공유기처럼 보입니다. 예를 들어 공유기의 크기를 생각해보세요. GPU 신호가 지나가는 관제소가 10~20cm를 이동해야 합니다.내부의 미세 공정에서는 수 cm의 이동 거리조차 심각한 신호 손실을 유발하는 일종의 장벽이 됩니다. 셋째, 이러한 이너넷 스위치에 신호를 복구해주고, 빠르게 이동시켜주기 위해서는 고성능 DSP가 필수적입니다. 하지만 DSP는 스위치 광학 연결 전력의 30~50%를 점유할 만큼 막대한 에너지를 소모합니다. 폭발적인 데이터 처리가 요구되는 AI 시대에는 클라우드 시대보다 훨씬 심각한 데이터 병목 현상이 발생합니다. 이것이 바로 네트워크 인터커넥트의 혁신, 즉 LPO나 CPO 기술이 이더넷 스위치 단에서 가장 먼저 요구되는 핵심 이유입니다. 3.2. 첫번째 병목해결사, 이더넷 스위치(Switch)에서 시작된 CPO 혁신 : 올해 적극적으로 도입 될 것, 2020 ~ 2026 위 사진은 브로드컴의 최신 이더넷 스위치 칩셋인 Tomahawk 5 기반의 CPO 모듈입니다. 앞서 본 사진들과 달리 장비(= 공유기처럼 생긴 Box)가 아닌 반도체 칩이 등장했죠? 과거 네트워크 시장은 시스코(Cisco)처럼 하드웨어와 소프트웨어를 직접 설계해 비싼 완제품을 파는 회사들이 지배했습니다. 하지만 브로드컴은 이 판도를 뒤집었습니다. 브로드컴이 범용 스위치 칩을 압도적인 성능으로 만들어 내놓자, 구글이나 아마존 같은 빅테크 기업들이 굳이 비싼 시스코 장비를 살 필요가 없어진 것입니다. 브로드컴 칩을 사서 껍데기(=Box)만 씌우면 최고 성능의 스위치가 되니까요. 물론 단점이 존재합니다. 과거 이더넷 스위치는 장비 전면에 수많은 광모듈(Pluggable)을 일일이 꽂아야 했습니다. 이 방식은 유지보수는 쉬울지 몰라도, 전기 신호를 멀리 보내기 위해 막대한 전력을 낭비하고 공간을 많이 차지하는 비효율이 존재했습니다. 하지만 위 사진처럼 광학 엔진을 칩 바로 옆에 통합시킨 CPO 방식은 이 문제를 해결했습니다. 거추장스러운 외부 모듈과 복잡한 배선을 제거하고, 가장 중요한 칩과 광학 엔진을 한 몸으로 만들어 전력 소모를 50% 이상 줄이고 데이터 처리 밀도를 극대화한 것입니다. 이에 따라 2020년대에 들어서며 브로드컴과 마벨의 칩을 사용하는 것은 이제 업계의 표준 되었습니다. 흥미로운 점은, 하드웨어 생태계를 개방하며 성장한 ...

CXL (Compute Express Link)

1. CXL (Compute Express Link) 이란? 고성능 컴퓨팅(HPC) 또는 연산이 필요한 시스템에서 CPU와 가속기(GPU, FPGA 등), 메모리, 스토로지 등을 더 효율적으로 연결하기 위해 고안된 차세대 인터페이스 표준을 말합니다. 쉽게 생각해서 CPU, GPU, 메모리 등을 효율적으로 연결하는 기술 안될공학님의 영상을 토대로 정의하자면 CXL을 "CPU의 메모리 용량 부족 문제를 해결하기 위한 확장 인터페이스"로 정의합니다. CXL은 기존 서버의 CPU 옆에 꽂을 수 있는 D램 슬롯(DIMM) 개수의 물리적 한계를 극복하기 위해 만들어졌습니다. 기존의 PCIe 슬롯을 활용하여 메모리를 추가로 장착하고 용량을 획기적으로 늘릴 수 있게 해주는 기술입니다. 2. CXL 3가지 타입 CXL 정의에 대항 이해가 어렵다면, 아래의 CXL type을 읽어보시기를 바랍니다. 저는 오히려 type보고, 이해가 쉬었습니다. 2.2. CXL 1.0 또는 1.1. CXL 1은 단순한 확장(Memory Expansion) 단계입니다. 가장 초기 단계로, CPU 연산을 위한 메모리 부족으로 단순히 "D랩을 더 꽂을 수 있게 해주는 개념"입니다. CPU 1개에 CXL 메모리 장치 1개를 직접 연결하는 1:1 연결만 가능합니다. 이 말인즉슨, 'CPU(a) - CXL(a)' 매칭되며, 'CPU(a) - CXL(b)' 간의 연결이 불가능하다는 것을 의미 합니다. 이에 따른 한계로, CPU의 데이터 정보를 모아주는 스위치(Switch)를 사용할 수 없어, 복잡한 네트워크 구성이 불가능합니다. AI 데이터 센터 인프라로 적합한 기술이 아닙니다. 2.1. CXL 2.0 CXL 2.0는 메모리 풀링(Memory Pooling) 단계입니다. 1에서 2로의 가장 큰 변화는 스위치(Switch)의 도입입니다. 이로 인해 여러 개의 CPU 정보를 모아주고 처리하는 게 가능해졌습니다. 특징 메모리 풀링: A서버(CPU1)가 바쁠 땐 메모리를 많이 주고, 한가해지면 ...

'26.01.07 메모

"2026년 주요 테마 5가지 - 골드만삭스" 주요 관심사. 추후 리서치할 ■ 테마 3: AI 투자의 다음 단계 다음으로, 골드만삭스는 지난 3년이 AI 인프라(반도체, 데이터센터)를 까는 시기였다면, 2026년은 AI가 실제 생산성과 물리적 세계로 확산하는 해가 될 것이라고 보았습니다. 따라서, 기존의 AI 인프라 관련주(엔비디아 등)는 여전히 성장하겠지만, 성장률 자체는 둔화할 수 있다고 보았는데요. 대신, 투자자들의 시선이 'Phase 3(소프트웨어/플랫폼)'와 'Phase 3-D(로봇/자동화)'로 옮겨갈 것으로 내다봤습니다. 그림 설명: AI 플랫폼 주식 (출처: 골드만삭스) Phase 3에서는 기업들이 AI를 실제 업무에 도입하면서 데이터베이스나 개발 도구를 제공하는 기업들의 매출이 늘어날 것으로 보았습니다. 이들 기업의 주가는 현재 3년 평균 PER보다 훨씬 낮게 거래되고 있어 가격 매력도 높다고 보았습니다. 그림 설명: 로봇 & 자동화 관련주 (출처: 골드만삭스) 이어서, Phase 3-D는 소위 '피지컬 AI'라고 불리는 AI가 물리적 세계와 만나는 지점을 의미하는데요. 2023년 초 챗GPT 등장 이후 반짝했던 로봇 관련주들은, 최근 밸류에이션 부담이 많이 낮아진 상황(PER 26배 수준)입니다. 이런 상황에서 기업 경영진들이 실적 발표에서 '로봇'과 '자동화'를 언급하는 빈도가 급증하고 있는 점도 긍정적인 신호라고 평가했습니다.

202

'26년 2월 5일, 스테이블코인에 대한 생각

메모

2026. 01. 28

17

1

328

CPO 발전 흐름, 그리고 CPO와 LPO 차이점

193

CXL (Compute Express Link)

60

'26.01.07 메모