

이번엔 "에이전트를 많이 굴리면 좋은건가?"라는 질문을 중심으로 엮어봤습니다.
인프라가 열리고, 도구가 쏟아지고 있는데, 무엇이 차이를 만드는지에 대한 이야기들이 좀 있더라구요.
에이전트를 둘러싼 인프라나 도구에 대한 이야기입니다.
Anthropic이 Opus 4.6과 Sonnet 4.6에서 1M(100만) 토큰 컨텍스트를 표준 가격으로 열었습니다.
기존에는 200k 토큰을 넘기면 입력 2배, 출력 1.5배 요금이 붙었거든요. 그 할증이 완전히 사라진거죠.
1M 토큰이면 어느 정도의 프로젝트 코드 전체를 한 세션에 올릴 수 있는 양이에요.
긴 문서 묶음이나 에이전트가 장시간 작업하는 세션도 끊김 없이 유지할 수 있습니다.
Claude Code 사용자들은 기본값으로 1M 컨텍스트를 받게 되면서 컴팩션(대화 압축) 이벤트가 15% 줄었다고 해요.
다만 무작정 긴 컨텍스트를 잘 처리하는건 아닙니다. 800~900K 토큰 구간에서의 성능 저하는 여전히 존재한다는 이야기도 있거든요.
제 주변에서도 여전히 200k 도달 전에 강제로 compact 시켜버리는 분들도 꽤 계십니다.
더 많이 넣을 수 있다고 해서 다 잘 읽는 건 아닌 셈이죠. '컨텍스트가 넓어졌으니 오히려 더 꼼꼼하게 관리해야 한다'는 실용적 인사이트가 유효한 것 같습니다.
하지만 에이전트를 오래 돌리는 게 비용 문제로 막혔던 시대가 점점 극복되고 있다고 봅니다.
인프라가 좋아지니까 사람들이 에이전트를 회사처럼 굴리기 시작했습니다.
AlexFinn이라는 사람은 OpenClaw 에이전트 10개를 24/7로 가동해서 자기 SaaS의 월 매출(MRR)을 25% 올렸다고 공개했습니다. "에이전트들이 새 기능을 브레인스토밍하고 만드는 걸 보면서, 승인 버튼만 누르면 프로덕션에 나간다"는 거죠.
OpenClaw 생태계가 하루 사이에 여러 업데이트를 쏟아냈는데요.
Chrome의 라이브 브라우저 원격 제어를 통합해서 에이전트가 사용자의 실제 로그인 세션에 접근할 수 있게 됐고, 스마트폰에서 새 에이전트 세션을 직접 띄울 수 있는 기능도 나왔습니다.
Microsoft와 Nvidia도 파트너십에 참여했다고 하네요.
15세 청소년이 OpenClaw로 3만 달러짜리 계약을 따낸 이야기가 190만 뷰를 찍기도 했습니다.
에이전트를 많이 굴리는 사람이 이기는 게임이 되어버린 걸까요.
r/ClaudeCode에서 흥미로운 글이 주목받고 있습니다.
"프레임워크는 에이전트를 어떻게 실행하는지 알려주지만, 어떻게 생각해야 하는지는 알려주지 않는다"는 ...

결국에 본인이 할 워크플로우를 쪼개고 카테고라이징해서 타입별 에이전트를 잘 설정하고 소환하는게 중요한 것 같습니다. 그리고 그게 곧 컨텍스트 관리일테니깐요! 오늘도 좋은 글 감사드립니다!! 소식 정말 알짜만 모아주시네요!!

공감합니다! 하나만 잘 설계해서 돌려도 저는 충분하다고 생각합니다.

똘똘한 에이전트 한 채,,,