글을 작성하던 와중에 Mythos/fable이 출시 되어 버렸습니다.. 해당 내용도 글 안에 포함 되어있긴 한데.. 양해 부탁드립니다..ㅠㅠ

단선
2026.06.09
[시리즈 연재] 최신 LLM 출시 관련 루머 정리 (Mythos, GPT-5.6, Gemini 3.5 Pro )
글을 작성하던 와중에.. Mythos가 출시 되었습니다.(2026.6.10 am 2:00..)
Mythos에 관련된 루머는 루머대로 읽어주시고 글 마지막에 실제 출시된 Mythos에 대한 정보도 따로 정리하겠습니다.
Claude Mythos
그렇게 호들갑을 떨면서 주식시장에 루머만으로도 큰 충격을 주었던 Claude Mythos에 대한 오늘 출시 확률이 Poly Market 기준으로 80퍼센트를 넘어가고 있습니다. 아마 글을 작성하고 바로 출시할 수도 있습니다. 나오기 전에 빨리 루머들을 정리 해보고 싶어졌습니다.
Mythos는 Fable이라는 이름으로 5 넘버링으로 나올 것으로 추정됩니다. 신화에서 우화면 Mythos를 바탕으로 경량화 한 모델이라는 뜻이겠죠?
Reddit r/ClaudeCode 글에 마이크로소프트 클라우드 서비스인 Azure의 백엔드 표에 claude-fable-5가 보였다는 이미지도 루머에 힘을 실어주고 있습니다.
몇달 전쯤에 유출되었던 루머로 Mythos의 입출력 토큰 비용은 100만 토큰당 25$/125$ 정도로 기존 모델인 Opus 계열 보다도 5배 가량 비싼 것으로 알려졌었죠.
하지만 경량화된 fable은 그정도 까진 아니고 Opus의 약 2배 비용 정도로 예상되네요.
그럼 유출된 성능들에 대해 알아보죠.
사이버 보안 관련된 것들은 워낙 유명하지만 저희 같은 일반인들은 직관적으로 체감하기 힘들죠. 그래서 많이 인용되는 것이 SVG와 복셀, 원턴 게임 만들기 등의 테스트 입니다.
SVG는 Scalable Vector Graphics의 약자로 크기를 늘리거나 줄여도 화질이 전혀 깨지지 않는 확장 가능한 벡터 그래픽 이미지 파일 포맷입니다. 나노바나나와 GPT-2같은 이미지 모델과는 다르게 LLM모델 자체의 멀티모달 시각인식과 프론트엔드 디자인 능력을 가늠해보는 것에 도움이 됩니다.
예를 들면 이렇게 이미지를 만드는 것이죠.
과거의 다른 LLM들이 만들었던 SVG들과 비교하면 감이 좀 오실 것 같습니다.
(https://x.com/Lentils80/status/2063686677160149501)
앞서 말한 1턴 게임 만들기와 복셀 출력물도 유출이 되었습니다.
복셀은 마인크래프트처럼 정육면체의 입체 픽셀을 말하는 것인데, 이 구조를 바탕으로 입체 공간을 만들어 달라고 하여 모델의 공간 지각능력 및 디테일 표현 능력을 볼 수 있습니다. 각 내용은 영상이기 때문에 직접 링크에서 보시는 것을 추천드립니다.
GPT-5.6
폴리 마켓 기준으로 GPT-5.6 은 6월 말 안에 출시하는 것에 높은 확률을 부여하고 있습니다.
계속 폴리마켓을 첫번째 기준으로 보는 이유는 AI 회사 관계자들이 폴리마켓을 내부자 정보를 이용하여 이익을 취하는 사례들이 많이 기사화 되고 있기 때문입니다.
디자인 아레나에 GPT-5.6 후보가 "kindle-alpha"라는 이름으로 잠시 등장했던 적이 있습니다. 디자인 아레나(Design Arena)는 전 세계 사용자들이 직접 참여해 인공지능이 생성한 디자인의 선호도를 평가하고 순위를 매기는 플랫폼입니다. 빅테크들이 새로운 모델들을 내놓기 전에 테스트 용으로 미리 업로드 하는 경우가 많기 때문에 루머 및 성능 추측을 하는것을 위해 많이 보는 곳입니다.
(https://x.com/chetaslua/status/2063132733052973119?s=20)
앞서 Mythos에서 봤던 SVG테스트 입니다. Mythos에 비하면 약간 부족해 보이긴 하지만 비용과 추론 시간을 생각해서 비교를 해야하긴 합니다. 어쨌든 비전문가 입장에서는 이렇게 눈에 보이는 것이 감을 잡기에 훨씬 도움이 되는 것 같습니다.
Gemini 3.5 Pro(가칭)
폴리마켓에서는 Gemini 3.5 Pro도 6월 안에 출시될 확률을 높게 보고 있네요
(https://x.com/pankajkumar_dev/status/2063984714810270046)
3.5 Pro는 아직 SVG나 복셀 처럼 시각적으로 따로 유출된 것은 없어 보입니다. 다만 위와 같은 트위터 글은 발견할 수 있었습니다. 아직 개선중이라면 순서상으로 6월 출시 예정 모델 중에 제일 마지막에 출시 하지 않을까 예상합니다.
Claude fable 5 출시
(https://www.anthropic.com/news/claude-fable-5-mythos-5)
글을 작성하던 와중에 실제로 Fable모델이 출시 되었습니다.. 이런..
벤치마크를 살펴보면 에이전틱 코딩 부분에서 큰 점수차를 보여주고 있습니다. 전체적으로 원래도 Opus가 gpt 계열에 비해 유리한 것만 모아놓았다는 느낌이 들지만 그 와중에도 불리하던 비전이나 공간 추론 부분에서 조차 성능향상을 보인 부분입니다. claude design에서도 더 큰 성능 향상을 기대할 수 있겠습니다.
SWE-Bench에서도 성능이 압도적이지만 FrontierCode벤치에서의 성능차이가 더 눈에 띕니다.
FrontierCode는 2026년 6월 9일, 코딩 에이전트 Devin의 개발사인 Cognition AI 공식 블로그를 통해 발표된 차세대 AI 코딩 성능 평가 벤치마크입니다. 기존 벤치마크(SWE-bench 등)가 단순히 코드가 테스트를 통과하는가만 검사했다면, FrontierCode는 "실제 수석 엔지니어나 오픈소스 유지보수자가 이 코드를 확인하고 내 코드베이스에 실제로 병합할 것인가?"를 엄격하게 평가합니다.
GPT-5.5 출시 이후 클로드 코드보다 Codex에 대한 평가가 우세한 요즘인 것과 제 카카오톡 대란 GPT pro 요금제 덕분에 codex를 메인으로 사용하고 있고 Calude는 20달러 플랜으로 사용해서 맛만 보고 있는데.. 이정도 유의미한 차이라면 Claude Max요금제를 고려해볼지도 모르겠습니다.
지금 시점에서 일반사용자는 Fable을 6/22일까지만 사용할 수 있고 그 이후는 미정입니다.. Max를 구독해볼까 했던 마음이 싹 사라지는 공지사항이군요.
Claude code를 메인으로 사용하고 계신 수많은 다른 Valley 이용자 분들의 후기를 기다리고 있겠습니다.
