프리미엄
예측대회
투자분석
아카데미
커뮤니티
로그인Valley AI 시작하기시작하기
Valley Space인기
왜 지금 SaaS를 다시 봐야 하는가
We need to go deeperUntitled

왜 지금 SaaS를 다시 봐야 하는가

avatar
KAVALAN
2026.05.25조회수 131회
avatar
KAVALAN
구독자 18명구독중 80명
지속가능하고, 반복가능한 투자를 지향합니다.

(AI를 활용하여 작성된 글입니다)

image.png

1. AI 대체 공포는 SaaS 전체가 아니라 일부 SaaS에 대한 경고입니다

2026년 들어 소프트웨어 시장을 흔든 핵심 변수는 프런티어 모델과 AI 에이전트의 발전이었습니다. 대형 언어모델은 더 긴 문맥을 처리하고, 더 복잡한 업무를 수행하며, 여러 도구를 호출하는 능력을 빠르게 키우고 있습니다. 문서, 코드, 데이터를 다루는 능력도 갈수록 좋아지고 있습니다. 사용자가 자연어로 지시만 하면 AI 에이전트가 CRM을 업데이트하고, 보고서를 만들고, 계약서를 검토하고, 고객 이메일을 보내고, 티켓까지 처리하는 시나리오가 점점 현실에 가까워지고 있습니다. 이 흐름은 기존 SaaS에 분명한 위협입니다. 사용자가 개별 SaaS 화면을 직접 클릭하지 않아도 AI 에이전트가 여러 업무를 대신 처리한다면, 일부 SaaS의 역할은 줄어들 수 있습니다. 특히 얕은 UI, 간단한 보고서, 단순 입력 자동화에 의존하는 제품은 AI 에이전트에 흡수될 가능성이 큽니다.


시장도 이 우려를 빠르게 반영했습니다. 2026년 2월 Anthropic의 기업 업무용 AI 도구 공개 이후 글로벌 소프트웨어·서비스 주식에서 약 1조 달러에 가까운 시가총액이 사라졌고, S&P 500 Software & Services Index는 6거래일 동안 약 13% 하락했습니다. 당시 투자자들은 AI가 법률, 영업, 마케팅, 데이터 분석처럼 기존 소프트웨어가 담당하던 핵심 영역으로 직접 들어올 수 있다고 봤습니다. 다만 이 매도세를 곧바로 “SaaS의 종말”로 해석하기는 어렵습니다.

 

AI의 위협은 모든 SaaS에 같은 방식으로 작용하지 않습니다. 단순 기능형 SaaS에는 분명한 위협이지만, 기업의 핵심 데이터, 권한 체계, 업무 프로세스, 감사 가능성, 사용자 접점을 이미 장악한 SaaS라면 이야기가 달라집니다. 이런 SaaS는 AI에 대체되는 대상이 아니라, AI가 기업 안에서 실제 돈이 되는 통로가 될 수 있습니다. AI가 기업 내부에서 제대로 작동하려면 단순한 모델 성능만으로는 부족합니다. 회사의 데이터에 접근해야 하고, 권한을 지켜야 하며, 실제 업무 흐름 안에서 행동해야 합니다. 이 조건을 이미 갖춘 곳이 SaaS입니다.


AI 투자의 초점도 이 방향으로 바뀌고 있습니다. 첫 번째 국면은 성능 경쟁이었습니다. 어떤 모델이 더 큰가, 어떤 벤치마크에서 더 높은 점수를 냈는가, 코딩·수학·추론·전문 시험에서 얼마나 뛰어난가가 중요했습니다. 두 번째 국면의 기준은 다릅니다. 이제 기업 고객은 AI가 얼마나 똑똑한지보다, 그 AI가 실제로 얼마를 벌어주거나 아껴주는지를 봅니다.

기업 고객이 궁극적으로 지불하는 것은 모델의 지능 그 자체가 아닙니다. 영업 생산성이 올라가고, 고객지원 비용이 줄고, 계약 검토 시간이 단축되고, 채용과 재무 프로세스가 빨라질 때 돈을 냅니다. 기업 AI의 최종 기준은 성능이 아니라 ROI입니다.

2. AI 경쟁의 초점은 성능에서 ROI로 이동하고 있습니다

최근 빅테크의 어닝콜에서도 이 변화가 확인됩니다. 벤치마크와 모델 성능은 여전히 중요하지만, 투자자 대상 설명에서는 추론 비용, 토큰당 효율, 사용량 기반 과금, 자본 효율성이 더 자주 등장합니다. 대표적으로 Microsoft는 어닝콜에서 주요 AI 모델의 추론 처리량을 40% 개선했고, 자체 AI 가속기가 토큰당 비용 효율을 30% 이상 개선한다고 설명했습니다. 기존 좌석 기반 소프트웨어 사업이 점차 “좌석 + 사용량” 모델로 확장될 수 있다는 말도 나왔습니다. AI가 단순히 더 똑똑해지는 단계를 지나, 실제 제품 안에서 얼마나 자주 쓰이고 그 사용량을 어떻게 과금할지가 중요해졌다는 뜻입니다.


이 변화는 SaaS 기업 투자 논지와 직접 맞닿아 있습니다. AI가 연구실의 벤치마크 경쟁에 머물 때는 반도체, 클라우드, 프런티어 모델 기업이 가장 직접적인 수혜주처럼 보입니다. 하지만 AI가 실제 제품과 업무 안으로 들어오면 가치가 생기는 지점이 달라집니다. 이제 중요한 것은 모델 그 자체가 아니라, 그 모델이 어디에서 추론되는지, 어떤 데이터를 읽는지, 어떤 업무를 실행하는지, 그 사용량을 고객에게 어떻게 과금할 수 있는지입니다. 여기서 SaaS의 가치가 다시 부각됩니다. AI의 ROI는 모델 혼자 만들 수 없습니다. ROI는 고객의 실제 업무 안에서 나옵니다. 그리고 그 업무는 이미 SaaS 위에서 돌아가고 있습니다.


CRM에는 고객 데이터와 영업 프로세스가 있습니다. HCM과 ERP에는 인사·재무 데이터와 승인 체계가 있습니다. ITSM에는 티켓, 장애 처리, 서비스 요청 흐름이 있습니다. 콘텐츠 SaaS에는 문서, 계약서, 정책 자료, 권한 체계가 있습니다. 협업 SaaS에는 프로젝트 이력과 팀의 업무 맥락이 쌓입니다. AI가 기업에서 실제 ROI를 내려면 이 데이터와 업무 흐름 안에서 작동해야 합니다. 모델의 성능이 아무리 좋아도 고객의 데이터와 프로세스에서 떨어져 있으면 업무 성과로 이어지기 어렵습니다. AI의 초점이 성능에서 ROI로 옮겨갈수록, 기업의 데이터와 워크플로를 이미 장악한 SaaS 기업의 가치가 커지는 이유입니다.

3. 프런티어 모델의 한계는 내부 데이터와 권한에⁠서 드러납니다

프런티어 모델이 아무리 강력해도 특정 회사의 내부 정보는 기본적으로 알 수 없습니다. 모델은 일반적인 지식과 공개 데이터, 학습 시점까지의 패턴을 바탕으로 답합니다. 하지만 한 회사의 최신 고객 계약, 영업 파이프라인, 미팅 기록, 지원 티켓, 재무 승인 이력, 인사 정책, 보상 데이터, 내부 문서의 최신 버전, 부서별 권한 체계까지 알고 있지는 않습니다.


예를 들어 영업 담당자가 AI에게 이렇게 요청한다고 해보겠습니다.

“이번 분기에 갱신 예정인 A 고객의 이탈 가능성을 분석하고, 담당자가 보낼 이메일 초안을 작성해줘.”

모델이 제대로 답하려면 A 고객의 계약 조건, 최근 사용량, 지원 티켓, 할인 이력, 경쟁사 언급 여부, 미팅 메모, 담당자 교체 여부를 알아야 합니다. 이 정보는 모델 안에 있지 않습니다. CRM, 고객지원 시스템, 계약 관리 시스템, 결제 시스템, 내부 문서 저장소에 흩어져 있습니다. 재무나 HR 업무는 더 민감합니다. 비용 절감 방안을 찾거나, 채용 후보자를 평가하거나, 조직 개편의 영향을 분석하려면 그럴듯한 답변만으로는 부족합니다. 어떤 데이터가 최신인지, 어떤 정책이 적용되는지, 누가 승인권자인지, 어떤 정보에 접근할 수 있는지까지 알아야 합니다. 권한, 정책, 승인 절차, 내부 통제, 감사 가능성이 함께 따라와야 합니다. 


그래서 기업 AI의 핵심은 단순히 좋은 모델을 도입하는 것이 아닙니다. AI가 회사 내부 데이터를 실제로 가져다 쓸 수 있는 상태로 만드는 것이 먼저입니다. 여기에는 여러 조건이 필요합니다. 데이터가 잘 정리되어 있어야 하고, 고객·계약·직원·제품·티켓 같은 핵심 정보가 서로 연결되어 있어야 합니다. 같은 고객이 CRM, 결제 시스템, 고객지원 시스템에서 서로 다른 이름으로 기록되어 있다면 AI는 정확한 판단을 하기 어렵습니다. 계약서는 문서 저장소에 있고, 사용량 데이터는 제품 분석 시스템에 있고, 지원 이력은 티켓 시스템에 있는데 이들이 서로 연결되어 있지 않다면 AI는 고객의 상황을 온전히 이해할 수 없습니다. 기업 AI에는 단순히 많은 ...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

Basic 7일 무료 체험 시작하기
이미 계정이 있으신가요?로그인하기
댓글 1개
avatar
Pioneer
2026.05.25

최근 SaaS 기업의 주가 흐름과 내러티브를 유심히 관찰 중인데 상당히 도움이 많이되는 글입니다. 감사합니다.

Untitled 카테고리의 다른글

휴머노이드는 어디서, 어떻게 배울 것인가

(AI를 활용하여 작성한 글입니다) 지난 글 : https://www.valley.town/space/@kavalan/articles/69f9cd106500861ea9e974f0 앞선 글에서는 휴머노이드를 단순히 사람처럼 생긴 로봇이 아니라, 사람이 만든 공간과 노동 시장, 그리고 인간 행동 데이터에 접속하기 위한 물리적 인터페이스로 정리했습니다. 휴머노이드가 사람의 형태를 택하는 이유는 낭만이나 SF적 상상력 때문이 아닙니다. 사람이 만든 세계에 들어가고, 사람이 쓰는 도구를 다루며, 사람의 행동 데이터를 학습에 활용하기 위해서입니다. 이번 글에서 다룰 질문은 조금 더 구체적입니다. 각 업체는 휴머노이드를 어떻게 학습시키려 하고 있을까요? 휴머노이드의 완성은 하드웨어를 잘 만드는 것만으로 끝나지 않습니다. 로봇이 사람의 공간에서 보고, 이해하고, 움직이고, 실패하고, 다시 배우는 루프를 만들어야 합니다. 결국 중요한 것은 로봇을 어디에 먼저 파느냐보다, 어떤 데이터를 모으고, 그 데이터를 어떤 모델에 넣고, 실제 환경에서 어떻게 검증하느냐입니다. Figure AI: Helix를 중심으로 행동 모델을 스케일할 수 있을까요? 먼저 Figure를 보겠습니다. Figure를 단순히 Figure 02나 Figure 03 같은 하드웨어 회사로만 보면 부족합니다. Figure의 중심에는 Helix가 있습니다. Figure가 공개한 Helix는 Vision-Language-Action 모델입니다. 쉽게 말하면 로봇이 카메라로 주변 환경을 보고, 사람의 언어 지시를 이해한 뒤, 이를 실제 손·팔·몸통의 움직임으로 바꾸는 모델입니다. Figure는 Helix가 인식, 언어 이해, 학습 기반 제어를 하나로 통합한 generalist VLA 모델이며, 손목, 몸통, 머리, 개별 손가락까지 포함한 휴머노이드 상체 전체를 고속 연속 제어한다고 설명합니다.  이것이 Figure 전략의 핵심입니다. 휴머노이드가 가정이나 산업 현장에서 유용해지려면 사람이 매번 작업을 프로그래밍할 수 없습니다. “이 컵을 집어”, “서랍에 넣어”, “옆 로봇에게 건네줘” 같은 자연어 지시를 이해하고, 처음 보는 물체에도 대응해야 합니다. Figure는 Helix가 하나의 신경망 가중치로 물건 집기, 물건 놓기, 서랍과 냉장고 조작, 로봇 간 협업까지 수행할 수 있다고 설명합니다.  (FigureAI) 이 이미지는 Figure가 Helix를 왜 중요하게 보는지 잘 보여줍니다. 기존 로봇 조작 방식에서는 새로운 행동을 만들 때 전문가가 직접 규칙을 짜거나, 많은 시연 데이터를 다시 모아야 했습니다. 반면 Figure는 Helix를 통해 새로운 행동을 언어로 지정할 수 있는 구조를 만들겠다고 주장합니다.  Helix의 구조도 흥미롭습니다. Figure는 Helix를 System 1과 System 2로 나눠 설명합니다. System 2는 장면과 언어를 이해하는 비교적 느린 시스템입니다. 인터넷 규모 데이터로 사전학습된 VLM을 기반으로, 로봇이 보고 있는 장면과 사용자의 명령을 해석합니다. 반면 System 1은 빠른 반응형 visuomotor policy입니다. System 2가 만든 의미 표현을 받아 실제 손, 손가락, 몸통, 머리 움직임을 200Hz로 생성합니다. 쉽게 말하면 System 2가 “무엇을 해야 하는지”를 판단하고, System 1이 “몸을 어떻게 움직일지”를 실행합니다.  (FigureAI) 데이터 전략도 Helix와 직접 연결됩니다. Figure는 Helix 학습에 약 500시간의 고품질 multi-robot, multi-operator teleoperation 데이터를 사용했다고 밝혔습니다. 여기서 Teleoperation은 단순한 원격조작이 아닙니다. 사람이 로봇을 움직이는 동안 로봇이 본 장면, 로봇의 상태, 손과 팔의 움직임, 작업 결과가 함께 기록됩니다. 이 데이터는 Helix가 “언어 지시를 실제 휴머노이드 몸의 움직임으로 바꾸는 법”을 배우는 재료가 됩니다. Figure는 또 비디오 클립을 보고 “이 행동을 시키려면 어떤 지시를 내렸을까”를 VLM이 자동으로 라벨링하는 방식도 사용합니다.  그런데 Figure의 학습 전략은 로봇 데이터에만 머물지 않습니다. Project Go-Big에서는 인간의 1인칭 행동 영상을 Helix 학습에 활용하겠다고 밝혔습니다. Figure는 로보틱스에는 ImageNet이나 YouTube처럼 대규모 행동 데이터셋이 부족하다고 봅니다. 휴머노이드가 인간과 비슷한 시점과 운동 구조를 갖기 때문에, 일상적인 인간 영상에서 로봇 행동으로 지식을 전이할 수 있다는 설명입니다. Brookfield와의 파트너십을 통해 주거, 오피스, 물류 공간에서 인간 행동 데이터를 수집하려는 계획도 공개했습니다.  이 부분은 1편의 내용와 이어집니다. 휴머노이드가 사람 형태를 택하는 이유는 사람처럼 보이기 위해서가 아닙니다. 사람의 공간에 들어가고, 사람의 도구를 쓰고, 사람의 행동 데이터를 학습에 활용하기 위해서입니다. Figure는 이 논리를 가장 적극적으로 밀어붙이는 회사에 가깝습니다. 결국 Figure는 휴머노이드 하드웨어 회사라기보다, Helix를 중심으로 로봇의 몸과 두뇌, 데이터를 함께 묶으려는 풀스택 피지컬 AI 회사에 가깝습니다. 성공한다면 강력한 전략입니다. 다만 난도도 높습니다. 하드웨어, 모델, 데이터, 가정용 안전성까지 함께 풀어야 하기 때문입니다. 1X: 가정 데이터를 학습 루프로 바꿀 수 있을까요? 1X는 사용자가 처음 언급한 “기기를 먼저 배포하고, 데이터를 쌓아 업데이트한다”는 전략에 가장 가까운 회사입니다. 다만 이 전략을 단순한 선판매나 소비자 시장 진입으로만 보면 부족합니다. 1X의 핵심은 가정이라는 비정형 환경을 학습 데이터의 원천으로 삼으려는 시도입니다. 1X는 NEO를 가정용 휴머노이드로 전면에 세웁니다. 공장이나 물류센터가 아니라 집입니다. 1X는 NEO가 집안의 지루하고 반복적인 일을 맡아 사용자의 시간을 돌려주는 로봇이라고 설명합니다. 사용자가 집안일 목록을 주거나 시간을 예약하면, NEO가 청소, 정리, 빨래 접기, 선반 정리 같은 작업을 수행할 수 있다고 소개합니다.  (1X) 핵심은 Expert Mode입니다. 1X는 NEO가 기본적으로 자율 동작하지만, 아직 모르는 집안일은 사용자가 1X Expert를 예약해 도움을 받을 수 있고, 그 과정에서 NEO가 작업을 수행하면서 배운다고 설명합니다. 복잡한 작업에 대해서는 Expert가 원격으로 감독할 수 있으며, 모바일 앱과 VR 기기를 통한 Remote Control도 가능하다고 설명합니다. 이 구조에서 사람의 개입은 단순한 대행이 아닙니다. 전문가가 로봇을 감독하거나 조작하는 과정에서 가정 내 작업 데이터가 쌓이고, ...
Untitled
2026. 05. 12
1
1
80
휴머노이드는 어디서, 어떻게 배울 것인가

왜 시장은 휴머노이드 로봇에 주목하는가

(AI를 활용하여 작성된 글입니다) 로봇이 꼭 사람처럼 생겨야 할까요? 휴머노이드 로봇을 볼 때마다 이 질문이 따라옵니다. 바퀴를 달면 더 안정적입니다. 산업용 로봇팔은 사람 팔보다 빠르고 정확합니다. 물류창고라면 로봇이 다니기 좋게 동선을 다시 짜면 됩니다. 특정 작업만 놓고 보면 사람 형태는 오히려 비효율적으로 보이기도 합니다. 두 다리로 균형을 잡아야 하고, 팔과 손가락은 복잡하며, 넘어질 위험도 있습니다. 그런데도 시장은 휴머노이드에 베팅하고 있습니다. 이유는 로봇공학의 낭만이 아닙니다. 훨씬 더 현실적인 계산이 있습니다. 휴머노이드는 좁은 의미의 로봇 시장이 아니라 사람이 하던 물리 노동 전체를 겨냥합니다. 기존 인간 환경을 그대로 쓸 수 있고, 딥러닝 학습에 필요한 인간 행동 데이터를 가져오기에도 상대적으로 유리합니다. 자율주행에서 이미 확인했듯, 피지컬 AI의 성능은 결국 데이터 플라이휠을 얼마나 잘 만드느냐에 달려 있습니다. 휴머노이드는 그 다음 전장입니다. 즉 휴머노이드는 “사람을 닮은 기계”라기보다 인간 세계에 들어가기 위한 폼팩터입니다. 시장, 인프라, 데이터가 같은 방향을 보고 있습니다. 지금 휴머노이드가 급부상하는 이유입니다. 가장 큰 TAM 휴머노이드가 주목받는 첫 번째 이유는 시장의 크기입니다. 로봇청소기는 청소 시장을 봅니다. AMR은 창고 안의 운송 시장을 봅니다. 산업용 로봇팔은 용접, 조립, 적재 같은 특정 제조 공정을 봅니다. 휴머노이드는 다릅니다. 이론적으로는 사람이 하던 물리 노동 전체를 겨냥합니다. 이 지점에서 두 타입의 차이가 선명하게 나타납니다. 휴머노이드는 로봇 시장 안에서만 계산되지 않습니다. 노동 시장과 연결됩니다. 로봇이 사람의 공간에 들어가고, 사람의 도구를 쓰고, 사람의 일을 일부 대체하거나 보조할 수 있다면 그 로봇은 단순한 자동화 설비가 아니라 노동의 대체재로 평가됩니다. 시장이 크게 보일 수밖에 없습니다. Morgan Stanley는 2025년 보고서에서 2050년 휴머노이드 시장이 5조 달러를 넘을 수 있고, 10억 대 이상의 휴머노이드가 사용될 수 있다고 전망했습니다. 동시에 2050년 기준 대부분의 휴머노이드가 산업·상업 목적의 반복적이고 구조화된 작업에 쓰일 가능성이 높다고 봤습니다. 중요한 건 숫자 자체가 아닙니다. 휴머노이드가 특정 기계 시장이 아니라 노동 시장을 겨냥하기 때문에 이렇게 큰 시장으로 계산된다는 점입니다. (Morgan Stanley, 2025) 물론 TAM이 크다고 초기 매출도 바로 커지는 것은 아닙니다. 처음부터 가정용 만능 로봇이 나오기는 어렵습니다. 초기 시장은 훨씬 좁을 가능성이 큽니다. 공장, 창고, 물류센터, 리테일 백룸처럼 작업이 반복적이고 실패 비용을 통제할 수 있는 곳이 먼저입니다. 그래도 방향은 분명합니다. 전용 로봇은 하나의 작업을 가장 잘하도록 만들어집니다. 휴머노이드는 여러 작업으로 확장될 여지를 갖습니다. 전용 로봇이 단일 작업의 효율을 높이는 기계라면, 휴머노이드는 노동 시장의 여러 빈칸을 하나씩 채워갈 수 있는 기계입니다. 시장이 여기에 관심을 갖는 이유입니다. 사람 형태는 기존 인프라를 그대로 쓰기 위한 선택입니다 휴머노이드가 사람 형태를 택하는 두 번째 이유는 기존 인프라입니다. 현대의 물리 환경은 대부분 사람을 기준으로 설계되어 있습니다. 문손잡이, 계단, 엘리베이터 버튼, 선반, 작업대, 공구, 카트, 공장 라인, 물류센터의 피킹 스테이션까지 모두 사람의 키, 팔 길이, 손, 시야, 이동 방식을 전제로 합니다. 로봇을 쓰는 방법은 두 가지입니다. 하나는 환경을 로봇에게 맞게 바꾸는 방식입니다. 컨베이어를 깔고, 로봇팔이 접근하기 쉬운 위치에 부품을 놓고, AMR이 다닐 경로를 정하고, 작업을 반복 가능한 형태로 표준화합니다. 이 방식은 강합니다. 자동차 공장, 반도체 공정, 대형 물류창고처럼 환경을 통제할 수 있는 곳에서는 전용 자동화가 휴머노이드보다 훨씬 효율적입니다. 하지만 이 방식에는 유연성이라는 측면에서 한계가 있습니다. 한번 설계된 설비는 다른 작업으로 쉽게 전환되기 어렵습니다. 특정 작업을 위해 만든 자동화 장비는 그 작업에서는 뛰어나지만, 작업 조건이나 공정이 바뀌면 활용도가 떨어집니다. 휴머노이드는 바로 이 지점에서 장점을 가집니다. 사람을 위해 ...
Untitled
2026. 05. 05
4

코드는 싸졌고, 판단은 비싸졌습니다

(AI를 활용하여 작성된 글입니다) 1. 구현에서 이동한 비용 코딩 에이전트가 바꾼 가장 큰 변화는 “개발 전체가 쉬워졌다”가 아니라, 코드 작성 비용이 낮아졌다는 점입니다. 예전에는 아이디어를 코드로 옮기는 일 자체가 큰 병목이었습니다. 요구사항을 읽고, API를 찾고, 보일러플레이트를 만들고, 오류를 고치고, 테스트를 붙이는 데 개발 일정의 상당 부분을 써야 했습니다. 이제는 자연어로 요구사항을 설명하면 코딩 에이전트가 초안을 만들고, 테스트 코드를 제안하고, 리팩터링 방향까지 제시합니다. 이 변화는 이미 개발 현장에 깊게 들어와 있습니다. 2025년 DORA 보고서는 응답자의 90%가 업무에서 AI를 사용하고 있으며, 80% 이상은 AI가 생산성을 높였다고 본다고 설명합니다. 동시에 30%는 AI가 만든 코드를 거의 신뢰하지 않거나 전혀 신뢰하지 않는다고 답했습니다. AI가 개발 속도를 높이는 것은 맞지만, 그 결과물이 곧바로 신뢰 가능한 production code가 되는 것은 아니라는 뜻입니다. 그렇다고 소프트웨어 개발 비용 전체가 낮아졌다고 말하기는 어렵습니다. 코딩 에이전트가 주로 낮춘 것은 코드 생성 비용입니다. 좋은 소프트웨어를 만들려면 여전히 요구사항을 정의해야 하고, 코드를 리뷰해야 하며, 테스트와 보안 검토를 거쳐야 합니다. 배포 안정성, 운영 가능성, 제품 판단의 비용도 사라지지 않았습니다. 코드 생성이 쉬워질수록 오히려 그 뒤에 있는 검증과 판단의 부담은 커질 수 있습니다. 한 명의 개발자가 하루에 만들 수 있는 코드의 양이 늘어나면, 팀은 그 코드가 정말 필요한지, 기존 시스템과 맞는지, 오래 유지할 수 있는지 더 많이 확인해야 합니다. 비용은 사라진 것이 아니라 이동했습니다. 구현 비용은 낮아졌지만 리뷰, 통합, QA, 보안, 기획 판단의 비용이 더 크게 보이기 시작했습니다. 강한 팀은 AI로 더 좋아질 수 있지만, 약한 팀은 AI 때문에 기존 문제가 더 선명하게 드러납니다. 특히 자동화된 테스트, 성숙한 버전 관리, 빠른 피드백 루프 같은 통제 장치가 없으면 변경량 증가가 안정성 문제로 이어질 수 있다고 지적합니다. 그래서 코딩 에이전트 시대의 핵심 질문은 “얼마나 빨리 코드를 만들 수 있는가”가 아닙니다. 더 중요한 질문은 “빨리 만들어진 코드를 팀이 어떻게 받아들이고, 무엇을 거절하며, 어떤 기준으로 검증할 것인가”입니다. 코드가 빨리 만들어지는 일은 분명한 진전입니다. 그러나 소프트웨어는 코드가 작성되는 순간 끝나지 않습니다. 코드는 리뷰되고, 병합되고, 테스트되고, 배포됩니다. 장애를 만들기도 하고, 다시 수정되기도 합니다. 몇 달 뒤 다른 개발자에게 읽히고, 몇 년 뒤 기술 부채로 돌아오기도 합니다. 코드 생산비용이 낮아졌다는 사실은 개발 조직에 축복이지만, 동시에 새로운 압박입니다. 이제 팀은 더 많은 코드 후보를 더 짧은 시간 안에 판단해야 합니다. 2. AI가 만든 그럴듯한 코드의 역설 코딩 에이전트의 부작용은 코드가 단순히 “나쁘게” 만들어진다는 이야기가 아닙니다. 더 정확히는 코드가 너무 쉽게, 너무 많이, 너무 그럴듯하게 만들어진다는 데 있습니다. 명백히 이상한 코드는 오히려 쉽게 잡힙니다. 문법 오류가 있거나, 테스트가 바로 깨지거나, 구조가 눈에 띄게 어색한 코드는 리뷰어가 빠르게 거절할 수 있습니다. 더 어려운 것은 겉으로는 자연스럽고, 변수명도 괜찮고, 테스트 일부도 통과하지만 실제 요구사항의 예외 케이스를 놓치거나 기존 시스템의 암묵적 제약을 깨는 코드입니다. AI가 만든 코드는 이런 방식으로 리뷰 비용을 높입니다. 리뷰어는 단순히 diff를 읽는 데서 멈출 수 없습니다. 그 코드가 어떤 가정 위에서 만들어졌는지, 그 가정이 팀의 도메인과 시스템에 맞는지까지 복원해야 합니다. Stack Overflow의 2025년 개발자 설문은 이 긴장을 잘 보여줍니다. 응답자의 84%는 개발 과정에서 AI 도구를 사용하거나 사용할 계획이 있다고 답했고, 전문 개발자의 51%는 매일 AI 도구를 사용한다고 답했습니다. 그런데 AI 도구 결과의 정확성에 대해서는 신뢰보다 불신이 더 컸습니다. AI 결과를 신뢰한다고 답한 비율은 33%였고, 불신한다고 답한 비율은 46%였습니다. 사용은 늘고 있지만 신뢰는 아직 충분하지 않은 상태입니다. 이 간극을 검증 부채라고 부를 수 있습니다. 기술 부채가 “지금은 빠르게 가기 위해 나중에 갚아야 할 구조적 비용”이라면, 검증 부채는 “지금은 빠르게 생성하기 위해 나중에 확인해야 할 불확실성”이라고 할 수 있습니다. 코딩 에이전트는 초안을 빠르게 만들 수 있습니다. 다만 그 초안이 production code가 되려면 요구사항 검증, 테스트 보강, 보안 점검, 기존 아키텍처와의 정합성 확인을 거쳐야 합니다. 이 과정을 건너뛰면 팀은 당장은 빨라진 것처럼 보일 수 있습니다. 그러나 나중에 더 큰 비용을 치르게 됩니다. 버그 수정, 장애 대응, 리팩터링, 온보딩 비용, 코드 이해 비용이 뒤로 밀릴 뿐입니다. 개발자들이 체감하는 문제도 여기에 가깝습니다. Stack Overflow 2025 설문에서 AI 도구를 쓸 때 가장 큰 불만은 “거의 맞지만 정확하지 않은 해결책”이었고, 66%가 이를 언급했습니다. 두 번째로 큰 불만은 “AI가 만든 코드를 디버깅하는 데 시간이 더 걸린다”는 것이었으며, 45.2%가 답했습니다. 즉, AI가 코드를 빠르게 만들어주지만, 그 코드가 애매하게 틀렸을 때 사람은 더 많은 시간을 들여 원인을 찾아야 합니다. 보안 리스크도 같은 구조로 생깁니다. AI가 만든 코드는 기능적으로 동작하더라도 보안적으로 안전하지 않을 수 있습니다. 특히 보안 요구사항은 명시하지 않으면 빠지기 쉽습니다. “파일 업로드 API를 만들어주세요”라는 요청에 인증, 권한, 파일 크기 제한, 확장자 검증, 악성 파일 검사, 저장 경로 제한, 로그 정책을 명시하지 않으면 AI는 기능 구현에 집중할 수 있습니다. 코딩 에이전트는 단순 자동완성 도구와도 다릅니다. 파일을 읽고, 명령을 실행하고, 외부 문서를 참고하고, 패키지를 설치하고, PR을 수정할 수 있습니다. 유지보수 측면에서도 같은 문제가 반복됩니다. AI는 새 코드를 만드는 데 강하지만, 좋은 소프트웨어는 새 코드를 많이 만든다고 완성되지 않습니다. 좋은 소프트웨어는 기존 구조를 이해하고, 불필요한 ...

특정 주제에 대한 내용 파악을 위해 뉴스 요약본을 바탕으로 graph를 생성해주는 pipeline - 2

이제 시작하기 전에 생각했던 기능이 어느정도 완성되었습니다. 하면서도 계속 고민이 되는 부분이 소스에 대한 한계였는데요. 소스로 네이버 뉴스 api를 사용했는데, 이게 뉴스의 요약본을 제공하는 형태라 아무래도 한계가 있을 수 밖에 없다고 생각되었습니다. 그 외에도 중복된 뉴스가 너무 많고 어뷰징을 위한 기사들도 많기 때문에, 일부 신문사(개인적으로 많이 들어본 신문사)를 중심으로 필터링하고 제목이 비슷하면 필터링 하는 등의 과정을 거쳤으나 그래도 여전히 많았습니다. DB에 내용을 잘 쌓아가려면 유의미한 기사를 중심으로 수집하는 것이 중요한데, 그게 어렵겠다는 생각이 많이 들었습니다. 그래서 다음은 텔레그램 메세지를 소스로 해서 비슷한 걸 해볼까 생각 중입니다. 저 같은 경우 텔레그램에서 몇몇 채널에 들어가있는 상태이지만 매일 그 메세지를 읽기에는 시간도 없고...
Untitled
2026. 03. 22
8
1
56

특정 주제에 대한 내용 파악을 위해 뉴스 요약본을 바탕으로 graph를 생성해주는 pipeline

이번에는 graph DB가 어떤 것인지, graph RAG는 어떤 효용이 있을 지 확인해보고자 진행했으나, graph RAG는 조금 더 공부해보고 이후에 다시 다뤄보려고 합니다. 이번에는 정말 아는 것도 없었고 "graphDB라는게 있다고 하네, 이렇게 해보면 되지 않을까?" 라는 생각에 진행한 것이라 대부분을 antigravity에 의존했습니다. 아래 이미지를 통해 대략적인 느낌을 확인하실 수 있으실 것 같습니다. 간단하게 설명하자면 LLM(Gemini API)을 활용해서 검색어에 대해서 정해진 기간 내의 이 요약본을 찾아보고(네이버 API), 요약본에 대해 엔티티와 관계 정보를 추출해 그래프 DB(Neo4j)로 구조화하도록 하였습니다. 이를 통해 사용자가 특정 기간 동안의 뉴스 흐름과 연관성을 직관적인 그래프 형태로 확인할 수 있도록 구현했습니다. 그래프의 엣지 부분에는 기사 링크가 연결되어있고 클릭 시 원문을 확인할 수 있게 구현했습니다. 기술적으로 이렇게 써보면 되겠다는 느낌은 받을 수 있었고 재미는 있었는데, 그래서 "너 이거 쓸거냐?" 했을때는 아직 많이 부족하다고 느껴졌습니다. 소스도 네이버 뉴스 API를 사용했는데, 이게 뉴스 요약본을 주는 거라 소스도 부족한 부분이 있습니다. graph RAG 등을 공부해보면서 어떻게 나아가면 좋을 지 생각해봐야겠습니다.
Untitled
2026. 03. 07
11
2
1
103
왜 시장은 휴머노이드 로봇에 주목하는가
Untitled
2026. 05. 03
8
0
105
코드는 싸졌고, 판단은 비싸졌습니다
특정 주제에 대한 내용 파악을 위해 뉴스 요약본을 바탕으로 graph를 생성해주는 pipeline - 2
103
특정 주제에 대한 내용 파악을 위해 뉴스 요약본을 바탕으로  graph를 생성해주는 pipeline