우리는 플레이어인가, 사후 해석자인가? (장문주의)

들어가며: “누가 거래하고 있는가?”라는 근원적 질문

이번에 이야기 할 프로그램 매매나 알고리즘 트레이딩 자체는 새삼스러운 소재는 아닙니다. 예전에도 있었고, 더 예전에도 있었습니다. 다만 이번 변화는 “속도”나 “규모”만의 문제가 아니었습니다. 거래를 수행하는 존재의 성격이 달라지고 있다는 점이 핵심입니다.

과거의 자동매매는 대체로 인간이 룰을 적어 내려가는 구조였습니다. “A 조건이면 매수, B면 매도” 같은 형태였고, 기계는 그것을 빠르게 실행하는 역할에 가까웠습니다. 인간이 주체고, 기계는 대리인 느낌이 강했지요. 문제가 생기면 책임도 대체로 인간에게 돌아갔습니다. 룰을 만든 사람이 있고, 승인한 사람이 있고, 돌린 사람이 있었으니까요.

그런데 2025년의 AI 트레이딩 이야기는 그 구조에서 한 단계 더 넘어갑니다. 텍스트를 이해하고, 맥락을 만들어내고, 목표를 받아서 실행 계획을 세우고, 심지어 도구(API, 거래 시스템)를 붙여 행동까지 하는 형태가 흔해졌습니다. “기계가 인간의 버튼을 대신 눌러준다”가 아니라, 기계가 스스로 버튼을 눌러야 한다고 판단하는 구간이 늘어났습니다. 인간은 감독자처럼 보이지만, 실제로는 나중에 로그를 보며 “왜 저랬지?”를 해석하는 역할로 밀리기 쉽습니다. 주체가 옮겨가는 느낌이 바로 여기서 생깁니다.

출처 : Blocmates. (2025, October 20). nof1.ai introduces Alpha Arena, a platform for AI-powered trading competitions. Blocmates. https://www.blocmates.com/news-posts/nof1-ai-introduces-alpha-arena-a-platform-for-ai-powered-trading-competitions

이 변화가 가장 자극적으로 드러난 무대가 Nof1의 Alpha Arena였습니다. 가상의 머니로 장난치는 대회가 아니라, 실제 자본을 넣고 실제 시장에서 거래하게 만드는 구조로 알려졌습니다. 중요한 건 여기서 “누가 이겼냐”보다 “무엇이 드러났느냐”입니다.

Alpha Arena는 미래의 축소판 같은 역할을 합니다. 시장이 사람 중심 광장에서, 서버실 속 알고리즘 충돌장으로 바뀌는 과정이 더 노골적으로 보이게 만들었습니다.

처음엔 관심이 단순했습니다. “미국 AI vs 중국 AI” 같은 국가 대항전 프레임이었지요. 하지만 최신 집계 화면을 포함해 흐름을 길게 보면, 그 프레임 자체가 어설프다는 게 드러납니다.

국가가 이기고 지는 이야기가 아니라, 모델과 운용 규율, 그리고 시장 레짐(Regime)이 맞물릴 때 결과가 얼마나 쉽게 뒤집히는지, 그리고 그 과정이 얼마나 위험한지 보여주는 사건이 되었습니다.

1. Alpha Arena의 의미: 기술 경연장이 아니라 ‘현실 경기장’ 실험

Alpha Arena 대회를 이해할 때 중요한 건 “벤치마크”라는 단어를 너무 쉽게 붙이면 안 된다는 점임. 일반 벤치마크는 정적 데이터, 고정된 정답, 반복 가능한 평가가 중심임. 근데 시장은 그 반대임. 정답이 없고, 누군가의 행동이 다른 누군가의 결과를 바꾸고, 관측 자체가 환경을 흔들어버림. 시장은 애초에 관측자와 행위자가 분리되지 않는 복잡계임.

Alpha Arena가 흥미로웠던 이유는 바로 그 “복잡계의 잔혹함”을 실험 형태로 꺼내 보여줬다는 점임.

실자본이 들어가면 리스크 관리가 곧바로 성적이 됨
거래가 공개되면 따라하기와 쏠림이 빨라짐
모델이 “말”을 잘해도, 포지션 관리가 무너지면 계좌가 먼저 무너짐
그리고 같은 모델도 운용 모드(제약/목표)에 따라 성적이 천국과 지옥으로 갈라짐

같은 이름의 모델이 어떤 모드에서는 +수익 상단을 찍는데, 다른 모드에서는 -50%, -80%, 심지어 -90%대에 가까운 붕괴가 보임. 이건 “모델 지능”만으로는 설명이 안 됨. 사실상 다른 규칙을 가진 다른 봇이라고 봐야 함.

여기서 이미 중요한 결론 하나 나옴.
AI 트레이딩의 핵심은 “모델이 무엇이냐”보다 “그 모델을 어떤 규율로 굴리느냐”에 더 가까워지고 있음. 그리고 규율은 공유되고 복제되기 쉬움. 이게 시장 안정성의 관점에서 굉장히 불길한 신호임.

2. 첫 번째 반전: “중국 모델 압승” 서사는 왜 오래 못 갔나

대회 초반(2025년 10월 전후)에는 “중국계 모델의 압승”이라는 이야기가 강하게 돌았음. DeepSeek이나 Qwen 같은 모델이 높은 수익률을 기록했다는 스냅샷이 퍼졌고, 반대로 서구 빅테크 모델들이 크게 손실을 냈다는 식의 요약이 돌아다녔음. 이 구간에서는 사람들 반응도 “이제 AI 패권도 중국으로 넘어간다” 같은 결론이 성급하게 붙었음.

근데 최신 집계 데이터는 그 서사를 아주 시원하게 뒤집어버림.

https://nof1.ai/leaderboard

최신 화면을 보면, 종합 1위가 Grok-4.20(당시 ‘미스터리 모델’로 불리던 항목)로 올라와 있고, GPT-5.1도 상단에서 플러스 수익을 기록하는 항목이 보임. 반면 초반의 상징이었던 DeepSeek이나 Qwen 계열은 모드에 따라 성적이 흔들리거나, 마이너스 구간이 뚜렷하게 나타남.

이 데이터의 핵심은 승패 판정이 아니라, 판의 구조가 바뀌고 있다는 데 있음

2-1. 시장에 영원한 승자는 없다는 오래된 격언이 AI 시대에도 그대로..

상승장에서 천재 소리 듣던 봇이 하락장에선 속절없이 무너지는 것도 같은 이치임. AI가 제아무리 연산을 빨리 돌린다 한들, 환경이 뒤집히면 그건 이미 룰이 바뀐 전혀 다른 게임이기 때문임.

이걸 좀 더 건조하게 말하면..

“좋은 예측”은 언제든 ‘구간 운’이 될 수 있음
“좋은 리스크 관리”는 구간 운이 아니라 생존 기술에 가까움
Alpha Arena가 보여준 건 결국 “예측 대결”이 아니라 “생존 대결”이었음

초반 스냅샷이 “중국 모델이 더 똑똑함”을 말한 게 아니라, 그때 그 환경에서 그 운용이 더 잘 맞았던 걸 수 있음. 최신 집계가 “서구 모델이 더 똑똑함”을 말하는 것도 아님. 다른 규칙과 다른 시장 구간에서 다른 방식이 더 오래 버텼다는 의미일 가능성이 큼.

2-2. 우리가 AI 지능을 과대평가하고 있던 건 아닌가 하는 질문

어떤 사람들은 종종 “데이터와 GPU만 있으면 시장을 정복할 수 있다”는 환상을 품음. 근데 시장은 정복 대상이 아니라, 적응 대상에 가깝다는 게 오래된 현실임. AI가 강해질수록 이 환상은 더 매혹적으로 보이는데, 그래서 더 위험해짐.

Alpha Arena의 최신 흐름은 이런 질문을 던짐.

모델 성능이 좋아도, 왜 이렇게 쉽게 터질 수 있나
“말이 그럴듯한 분석”이 왜 실전 수익으로 이어지지 않나
인간이 망하는 방식(과매매, 손절 지연, 군중 심리)이 왜 AI에서도 반복되나

이 질문들의 답은 대체로 “시장 예측”이 아니라 “거래 행동”에 있음. 즉, 지능(IQ)이 아니라 규율(Discipline) 쪽임.

3. AI의 성격 테스트: 4가지 운용 모드가 드러낸 생존의 조건

Alpha Arena 최신 집계 화면에서 가장 눈에 띄는 건, 모델이 단순히 “한 번” 참가한 게 아니라 여러 운용 모드로 쪼개져 평가된다는 점임. 화면에서는 대략 이런 모드 구성이 보임.

New Baseline
Monk Mode
Situational Awareness
Max Leverage

이 4개는 사실 “AI에게 다른 성격을 주고, 같은 시장에서 어떻게 나타나는지 보는 실험”에 가까움. 그리고 최신 화면은 그 실험이 꽤 잔인한 결과를 뱉고 있음을 보여줌.

3-1. New Baseline: 통제 없는 자유가 부른 참사

New Baseline은 말 그대로 기본 모드임. “특별한 통제 없이 알아서 해봐”에 가까운 상태로 이해하면 됨. 결과는 직관과 다르게 나오는 경우 많음. 고성능 모델들이라고 해서 기본 모드에서 안정적으로 이기는 게 아님. 오히려 이 모드에서 처참하게 깨지는 항목들이 많아 보임.

왜 이런 일이 생기냐면, 통제가 없으면 AI도 인간 초보 투자자와 비슷한 오류를 반복하기 쉬움.

작은 소음에 과잉 반응함
포지션을 자주 뒤집음
거래 횟수가 늘고 수수료가 누적됨
손절은 빠른데, 손절을 너무 자주 해서 계좌가 닳아감
혹은 반대로 손절이 늦어져 큰 손실이 터짐

기본 모드의 실패가 말해주는 건 간단함.
지능이 높아도 원칙이 없으면 도박판이 됨.
이건 AI 시대에도 그대로임.

3-2. Monk Mode: 절제가 곧 능력임

Monk Mode는 이름부터 수도승 느낌임. “확실한 기회 아니면 움직이지 말라”에 가까운 제약을 걸어놓은 형태로 알려져 있음. 최신 화면에서도 상단에 Monk Mode 항목들이 꽤 보임. Grok-4.20의 Monk Mode가 플러스 수익으로 상단에 있고, DeepSeek도 Monk Mode에서 플러스가 보임. ...

들어가며: “누가 거래하고 있는가?”라는 근원적 질문

1. Alpha Arena의 의미: 기술 경연장이 아니라 ‘현실 경기장’ 실험

2. 첫 번째 반전: “중국 모델 압승” 서사는 왜 오래 못 갔나