얼마전 홍콩대학에서 재밌는 논문이 나와서 소개합니다. 참고로 논문 원본은 여기서 확인하실 수 있습니다. 바쁘신 분들을 위해 논문 내용을 간략히 요약해드리자면
LLM 에이전트 대상의 완전 자동화된 실시간 평가 벤치마크인 AI-Trader로 6개의 주요 LLM (DeepSeek v3.1, MiniMax M2, Claude 3.7 Sonnet, Qwen3 Max, Gemini 2.5 Flash, GPT-5)을 평가하고 인덱스 (QQQ등)와 비교합니다. 논문 부록을 보면 에이전트를 위한 프롬프트까지 나와있으니 관심 있는 분들은 원본을 읽어보세요.

자산군은 미국 주식, A주(중국 본토 주식), 암호화폐 등 세 가지 주요 금융 시장에 대해서 비교합니다. 목표를 설정해주면 에이전트가 필수적인 맥락만 제공받고 인간의 개입 없이 실시간 시장 정보를 독립적으로 탐색, 검증 및 합성해야 하는 혁신적인 '완전 자율 최소 정보 패러다임(fully autonomous minimal information paradigm)'을 구현했다고 합니다. 에이전트가 알아서 계산도 하고 뉴스도 찾아보면서 매수/매도 결정을 스스로 ...








