
요즘 팔란티어의 주가가 바닥을 치고 있고, 사스포칼립스의 논리가 시장을 지배하고 있다. 그에 대해서 정말 그런가? 나는 아닌 것 같은데, 라는 생각이 들어 정리해 보았다.
요즘 AI로 뭔가를 만드는 건 점점 쉬워지고 있지만, 그걸 연속적으로 운영하는 일의 무게는 대부분 인지하지 못하는 듯하다. 가동률(Availability)은 생각보다 중요한 포인트이다.
흔히 쓰리나인이라 부르는 99.9%는 1년에 다운타임을 8.76시간만 허용한다는 뜻이고, 포나인(99.99%)이면 52분까지 줄어든다. 이 숫자는 보통 계약서에 가용성 보장 조항으로 박혀 들어가는 약속이라(우리나라도 일정 규모 이상의 서비스는 장애가 일정 시간을 넘으면 당국에 보고해야 한다), 90 → 99 → 99.9 → 99.99로 한 자릿수가 올라갈 때마다 들어가는 비용과 시간이 지수적으로 늘어난다.
팔란티어가 다루는 전쟁 시뮬레이션처럼 결정적 정확도가 그 약속의 핵심인 도메인에서는, 이 0.1%, 0.01%의 차이가 시스템을 쓰는 이유 그 자체다.
이 구간은 단순 스크립트성 개발만 해본, 운영 데이터의 규모가 작은 사람에게는 잘 보이지 않는 영역일 것 같다. 지금 sns 에서 글을 쓰는 사람들을 보면, 바이브 코딩에 심취해 있는 대다수는 스크립트성 작업이나 규모가 작은 데모는 잘 굴러가는 90% 수준이고, 90프로가 만들어 졌으니 24/365로 굴러야 하는 99.9%에 대해서 너무 쉽게 생각하는 경향이 보인다.
운영하다 보면 엣지 케이스, 데이터 드리프트, 권한·감사, 부분 실패 처리, 사람 손이 들어가야 하는 회색지대 같은 것들과, 연속성을 위해 오히려 일부 성능을 떨어트리는 등 서비스를 굴리기 위해 내려야 하는 트레이드오프 판단을 해보는 것도 좋아 보인다
운영하는 소프트웨어 사용자에 대한 농담 중에 "당신 서비스의 사용자는 방금 글을 깨우친 원숭이거나, 18살 펜타곤 해커다"라는 표현이 있는데, 본인만을 위해 만들 때와 불특정 다수가 쓰는 시스템을 만들 때는 정말로 다른 일이다. 이런 부분을 메우기 위해 인간이 완전히 대체될 수 없는 간극은 결국 이 지점에 남아 있다고 본다.
요즘 클로드에서도 직원을 파견해 각자 시스템을 같이 구축해 주는 사업을 하는것으로 보이는데, 팔란티어가 직원을 파견해 같이 구축해 주는 것과 비교해 보면 같아 보이지만 내 생각엔 결이 좀 달라 보인다. 파견된 직원의 역할로 보면, 클로드 쪽은 통합 소프트웨어를 "눈에 보이게 돌아가는 모습"으로 만드는 게 먼저고,...

좋은글 감사합니다