지난번에는 '맥락을 설계하라'는 개념적인 이야기를 했었는데, 이번에는 그 개념이 산업 규모로 실현되고 있는 현장에 대한 소식들이 있네요.

그와 동시에 지금의 LLM 베이스 구조가 드러내는 한계도 있습니다.

에이전트가 강력해질수록, 에이전트가 틀렸을 때 그걸 어떻게 아느냐가 점점 더 중요해지고 있는 것 같아요.

포커스

에이전트가 산업 인프라가 되고, 스스로 진화하고, 그러면서도 자기가 틀렸는지 모른다는 이야기입니다.

에이전트가 산업 인프라로 진입한다

Stripe의 코딩 에이전트 'Minions'는 매주 1,300개의 PR을 완전 자동으로 처리합니다. 사람이 코드를 한 줄도 쓰지 않는 PR이 매주 천 건 넘게 머지되고 있다는 거죠.

하드웨어도 따라가고 있습니다. NVIDIA는 GTC 2026에서 Vera CPU를 발표했는데, 이건 에이전트 AI를 위해 설계된 전용 프로세서입니다.

기존 GPU가 병렬 연산에 최적화되어 있었다면, Vera는 에이전트 실행에 필요한 직렬-병렬 혼합 워크로드에 맞춰져 있구요.

Emergent라는 플랫폼은 비개발자가 50만 달러 규모의 소프트웨어를 5천 달러 미만으로 구현할 수 있게 해줍니다. Google, Amazon 출신 형제가 만든 이 플랫폼에서는 에이전트가 코드 리뷰, 테스트, 디버깅을 실제 엔지니어링팀처럼 수행하고, 생성된 작업 궤적을 장기 기억에 저장해서 유사한 문제가 생기면 성공률을 높이는 구조를 갖추고 있습니다.

Stratechery의 Ben Thompson은 이런 흐름을 보며 "우리는 버블 안에 있지 않다"고 선언했습니다. 에이전트 기반 컴퓨팅은 거품이 아니라 새로운 기반 인프라라는 거죠.

"에이전트를 써볼까"가 아니라 "에이전트 없이 어떻게 하지"로 질문이 바뀌고 있습니다. 도구에서 인프라로, 인프라에서 산업으로 전환이 빠르게 진행되고 있구요.

에이전트가 스스로 진화한다

에이전트가 인프라가 됐으면, 다음 질문은 자연스럽습니다. 에이전트가 스스로 나아질 수 있느냐.

AGR(Artificial General Research)이라는 자율 연구 루프가 공개됐습니다. Karpathy의 autoresearch 개념에서 영감을 받은 건데, 지표와 가드레일만 정의하면 에이전트가 자율적으로 실험하고, 측정하고, 커밋하고, 실패하면 폐기하는 사이클을 반복합니다. 실측 결과가 인상적이에요. C++ 라이브러리 실행 시간을 53초에서 28초로 46% 단축했고, 14회 자율 실험 중 7회가 채택됐습니다.

RLM(Recursive Language Modeling)은 한 걸음 더 나갑니다. 에이전트의 실행 흔적 자체를 데이터로 삼아 실패 패턴을 추출하는 방식인데, GPT-5-mini가 RLM을 적용했을 때 GPT-5 본체보다 OOLONG 벤치마크에서 2배 이상 성과를 냈다는 결과가 나왔습니다. 소형 모델이 대형 모델을 이기는 거죠. 모델 크기가 아니라 루프의 품질이 성능을 결정한다는 이야기입니다.

SkillNet 논문은 에이전트 스킬을 3계층 온톨로지(분류체계 → 관계 그래프 → 패키지 라이브러리)로 자동 구조화하는 방법을 제시했구요. Ouroboros라는 프로젝트는 MCP의 방향성 자체를 뒤집었습니다. 기존에는 "AI가 도구를 호출"하는 방식이었는데, Ouroboros는 "도구가 AI를 사용하도록" 설계됐습니다. MCP 호출 한 번으로 내부에서 작업을 쪼개고, 각 작업마다 새 AI ...

안녕하세요! 저도 5년차 개발자로서, 항상 덜아픈손가락님 글 보면서 많은 인사이트를 얻고 있습니다 ㅎㅎ

본문 외적으로 궁금한 점이 하나 있는데,, 내용에 첨부된 출처들이 엄청 다양한데(ex. X, 레딧, 긱뉴스, 공식 홍페이지 등등), 혹시 이런 최신 정보들은 어떤 식으로 접하시나요!??

저는 기껏해야 엔트로픽, 커서 등등 공식 홈페이지에 올라오는 최신 포스팅 정도 챙겨보고 있는데, 손가락님은 되게 다양하게 많은 정보를 챙겨보고 계신거 같아서요!

혹시 따로 챙겨보는 사이트나 플랫폼, 채널 같은게 있는지 궁금합니다! (아니면 생각날 때마다 직접 서칭하시는건가요,,?)

항상 좋은 글 감사합니다!

감사합니다!

제가 직접 보는건 주로 링크드인과 X, 뉴스레터인데요.

글을 작성할 때 소스는 X, 링크드인, RSS, 유튜브를 위주로 봅니다. 그때그때 괜찮은 컨텐츠를 제공하는 분들이나 채널을 발견하면 팔로우 해두는 편이에요.

X, 링크드인은 AI 생태계 인플루언서나 괜찮은 하네스 엔지니어링 레포 가지신 분들 위주로 보구요.

RSS는 GeekNews, Hacker News, Stratechery 등등 AI/테크 섹션을 봐요.

유튜브도 마찬가지로 AI/테크/스타트업 채널위주로 보는데, 요즘은 영상은 보지 않고 정리된 내용만 보고 있습니다.

제가 직접 모든걸 서치하진 않고, 매일 오전 Claude와 Gemini가 수집 후 분별/정류 작업을 거쳐서 제공하는 자료들을 보고 난 뒤 (시간이 나면) 글을 작성합니다.

잘 읽었습니다.

결국 ai에 전적으로 의지하게 만드는 것이 기업들이 원하는 목표고

그걸 구별해낼 수 있는 능력을 함양하는 것이 개인들에 있어서 중요한 요소가 되겠네요..

마치 초창기 할루시에이션을 구분하는 것이 더 개선되어 더 어려워지는...

ㅠㅠ

무언가 하고자 하는 의도와 의지, 목적지까지 올바르게 다다르도록 관리할 수 있는 사고력과 분별력이 중요한 것 같습니다.

안녕하세요! 저도 5년차 개발자로서, 항상 덜아픈손가락님 글 보면서 많은 인사이트를 얻고 있습니다 ㅎㅎ

혹시 따로 챙겨보는 사이트나 플랫폼, 채널 같은게 있는지 궁금합니다! (아니면 생각날 때마다 직접 서칭하시는건가요,,?)

항상 좋은 글 감사합니다!

감사합니다!

제가 직접 보는건 주로 링크드인과 X, 뉴스레터인데요.

X, 링크드인은 AI 생태계 인플루언서나 괜찮은 하네스 엔지니어링 레포 가지신 분들 위주로 보구요.

RSS는 GeekNews, Hacker News, Stratechery 등등 AI/테크 섹션을 봐요.

유튜브도 마찬가지로 AI/테크/스타트업 채널위주로 보는데, 요즘은 영상은 보지 않고 정리된 내용만 보고 있습니다.

잘 읽었습니다.

결국 ai에 전적으로 의지하게 만드는 것이 기업들이 원하는 목표고

그걸 구별해낼 수 있는 능력을 함양하는 것이 개인들에 있어서 중요한 요소가 되겠네요..

마치 초창기 할루시에이션을 구분하는 것이 더 개선되어 더 어려워지는...

ㅠㅠ

무언가 하고자 하는 의도와 의지, 목적지까지 올바르게 다다르도록 관리할 수 있는 사고력과 분별력이 중요한 것 같습니다.

포커스

에이전트가 산업 인프라로 진입한다

에이전트가 스스로 진화한다

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

2026.03.15 - 코드 대신 맥락을 설계해야

2026.03.14 - 에이전트는 많을수록 좋은 걸까

2026.03.13 - AI가 사람을 대체하지 않는다고요?

2026.03.15 - 코드 대신 맥락을 설계해야

2026.03.14 - 에이전트는 많을수록 좋은 걸까

2026.03.13 - AI가 사람을 대체하지 않는다고요?

2026.03.17 - 에이전트가 확신할수록 의심해야 하는 이유

포커스

에이전트가 산업 인프라로 진입한다

에이전트가 스스로 진화한다

회원가입만 해도이 글을 무료로 읽을 수 있어요.

2026.03.15 - 코드 대신 맥락을 설계해야

2026.03.14 - 에이전트는 많을수록 좋은 걸까

2026.03.13 - AI가 사람을 대체하지 않는다고요?

2026.03.15 - 코드 대신 맥락을 설계해야

2026.03.14 - 에이전트는 많을수록 좋은 걸까

2026.03.13 - AI가 사람을 대체하지 않는다고요?

회원가입만 해도
이 글을 무료로 읽을 수 있어요.