포커스

에이전트를 둘러싼 인프라나 도구에 대한 이야기입니다.

1M 토큰, 추가 요금 없이

기존에는 200k 토큰을 넘기면 입력 2배, 출력 1.5배 요금이 붙었거든요. 그 할증이 완전히 사라진거죠.

1M 토큰이면 어느 정도의 프로젝트 코드 전체를 한 세션에 올릴 수 있는 양이에요.

긴 문서 묶음이나 에이전트가 장시간 작업하는 세션도 끊김 없이 유지할 수 있습니다.

다만 무작정 긴 컨텍스트를 잘 처리하는건 아닙니다. 800~900K 토큰 구간에서의 성능 저하는 여전히 존재한다는 이야기도 있거든요.

제 주변에서도 여전히 200k 도달 전에 강제로 compact 시켜버리는 분들도 꽤 계십니다.

더 많이 넣을 수 있다고 해서 다 잘 읽는 건 아닌 셈이죠. '컨텍스트가 넓어졌으니 오히려 더 꼼꼼하게 관리해야 한다'는 실용적 인사이트가 유효한 것 같습니다.

하지만 에이전트를 오래 돌리는 게 비용 문제로 막혔던 시대가 점점 극복되고 있다고 봅니다.

인프라가 좋아지니까 사람들이 에이전트를 회사처럼 굴리기 시작했습니다.

OpenClaw 생태계가 하루 사이에 여러 업데이트를 쏟아냈는데요.

Microsoft와 Nvidia도 파트너십에 참여했다고 하네요.

15세 청소년이 OpenClaw로 3만 달러짜리 계약을 따낸 이야기가 190만 뷰를 찍기도 했습니다.

에이전트를 많이 굴리는 사람이 이기는 게임이 되어버린 걸까요.

"프레임워크는 에이전트를 어떻게 실행하는지 알려주지만, 어떻게 생각해야 하는지는 알려주지 않는다"는 ...