몽상과 사색의 톡

GOAT

911GT3RS

2026.02.13

Cerefin AI는 금융시장의 팔란티어가 되려는 것이다

이번주 내내 나는 클로드 4.6 Opus를 이용해서 팔란티어 프로젝트라는 이름만 거창한 코딩작업에 푹 빠져있었다. 팔란티어 프로젝트 구상 팔란티어 프로젝트 (2026-02-13) 요약하자면, 팔란티어의 온톨로지를 실제로 투자목적으로 만들어보려는 시도이다. 여담이지만 나는 코드를 단 한줄도 처음부터 끝까지 적을 줄 모르는 코알못이다. 그런 내가 1만줄이 넘는 코드를 이용해서 이런 시도를 할 수 라도 있게 해준 것은 순전히 커서AI와 클로드 4.6 Opus 덕이다. 정말 정말 꼭 한번 경험해보길 강력 추천해본다. 그 과정에서 조금 정확하지는 않을 수 있지만 팔란티어가 어떻게 온톨로지로 세상에서 벌어지는 일들을 규정하는지 아주 조금이나마 알 것 같다는 느낌을 받았다. 이 마저도 매우 부정확하게 내가 곡해한 것일 수도 있고, 내가 너무 단순화한 것일 수도 있다. 그리고 필연적으로, 이 길은 Cerefin AI와도 닿아있다고 느꼈다. 그냥 하다보니까 "아 이게 이래서..."라는 생각이 자연스럽게 들 수밖에 없었다. 주인장님과 뉴로퓨전은 대체 이걸 얼마전부터 내다보고 연구하고 있었던 것인가... 라는 경외감이 들었다. 1. 팔란티어가 세상을 재구성하는 방법 팔란티어는 온톨로지(Ontology)라는 개념을 이용해 3차원 세상에서 벌어지는 일들을 시간의 경과까지 반영해서 텍스트와 숫자로 된 2차원 세상(DB)로 변환하여 저장한다. 온톨로지는 철학에서의 존재론이라는 의미이다. 물론, 있어 보이기 위해 마케팅용으로 거창하게 지은 것도 일부 있겠지만, 3차원 세상에서 시간의 흐름에 따라 일어나는 모든 일, 즉 4차원의 개념을 어떻게 글자와 숫자라는 2차원 데이터에 복사할 수 있는가라는 답을 어느 정도 제시했다는 점에서 충분히 가치있는 네이밍이라고 생각한다. 이 복사된 실제 세상을 팔란티어는 디지털 트윈이라고 한다. 디지털 트윈이란 말 그대로 현실을 컴퓨터가 이해하는 방식으로 변환하여 만들어놓은 현실의 복사판이다. 이게 어떻게 가능할까? (적어도 내가 이해한 바에 의하면) 팔란티어의 온톨로지는 세상의 역학을 다음과 같은 5가지로 나눈다. 객체 (Objects) 속성 (Properties) 관계 (Links) 이벤트 (Events) 모델 (Models) / 액션 (Actions) 요즘 만들고 있는 팔란티어 프로젝트를 통해 직접 하나씩 설명해보겠다. 객체 (Object) : 대상, 존재 객체란, 이 세상에 존재론적으로 존재하는 어떤 구분 가능한 대상이다. 트럼프, 머스크, 젠슨황 같은 인물이 될 수도 있다. TSMC나 NVDA 같인 기업이 될 수도 있다. 연준과 같은 기관일 수도 있다. 위 사진에서 하얀 점인 엔비디아는 내가 조회한 객체이고, 옆에 파란점들은 전부 객체(기업)들이다. 초록색으로 보이는 Elon Musk라는 점은 객체(인물)이기 때문에 다른 색 원으로 표기했다. 아무튼 오브젝트는 식별할 수 있는 어떤 존재이기만 하면 된다. 속성 (Properties) : 능력치 속성이란, 말 그대로 이 객체들이 가지고 있는 특성이나 능력치 같은 것들이다. 사람이라면 탄생일자, 키, 몸무게, 평소 앓고 있는 지병, 다니는 회사, 연봉 등 정말로 그 객체에 대한 많은 능력치 정보들이다. 객체가 기업일 경우 본사위치, 연 매출액, 직원 수, 해외 공장 위치, CEO 등등 여러가지 정보들이 될 수 있다. 위 사진은 NVDA의 속성의 일부인데, 본사의 위치는 Santa Clara, 국가는 미국기업, 설립일은 1993년 이런 기본적인 정보들이 담겨있다. 이 속성들은 여러가지 서로 다른 오브젝트들을 동일한 기준으로 분류/비교할 수 있게 만들어준다. 가령 속성-섹터가 똑같이 반도체(Semiconductor)로 분류된 기업들은 외부 이벤트가 발생했을 때, 비슷한 영향을 받도록 설계할 수 있다. 예를 들어 트럼프의 관세 부과 이벤트가 발생했을 때 영향을 받을 받을 기업들에 대해 알고싶다고 가정해보면, 속성-국가-미국에 속해있고, 속성-섹터-반도체인 기업들에게는 전부 관세로 인해 속성 - 매출원가에 부정적인 방향(-) 방향으로 변화할 것이라는 것을 알 수 있다. 이 속성에서 중요한 점은 단순히 현재의 상태(Status)를 나타내는 것이 아니라, 시간의 흐름에 따라서 외부 이벤트 발생하면서 캐릭터의 능력치가 변화한 이력이 기록되어야 한다는 점이다. 이렇게 시간의 흐름에 따라 기록되어야 하는 이유는 밑에 등장할 이벤트와 액션 때문인데, 해당 부분에서 후술하겠다. 관계(Links) 관계는 객체들끼리 맺고 있는 관계이다. 경쟁자일수도, 공급자일 수도, 고객일 수도 있다. 관계 필터를 경쟁자(Competitor)로 놓았을 때의 엔비디아와 주변 기업들의 관계도 관계 필터를 고객(Customer)로 놓았을 때의 엔비디아와 주변 기업들간의 관계도 그리고 이렇게 관계 사이의 노드(선)에 커서를 올리면 해당 객체들이 어떤 이유로 관계를 맺고 있는 지를 알 수 있다. 이런 식으로 관계 개념은 기업이라면 특정 섹터를, 인물간이라면 갈등/협력관계를 한눈에 보기에 유용하다. 가령, 속성 필터를 섹터-반도체로 1차 필터링 한 다음, 관계 필터를 경쟁자/공급자/고객/파트너로 바꿔가면서 밸류체인간의 기업들의 관계에 대해 생각해볼 수 있다. 관계는 어떤 특정 이벤트가 발생했을 때, 이 영향이 해당 객체에 부정적으로 작용할 지, 긍정적으로 작용할지 영향값의 부호를 결정하는 데에도 활용될 수 있다. 가령 객체-인텔의 반도체 공정 수율이 급락했다는 이벤트가 발생한다면, 인텔과 관계-고객으로 이어져 있는 기업의 속성-매출에는 음(-)의 영향으로, 관계-경쟁자로 이어져 있는 삼성전자 등의 속성-매출에는 양(+)의 값으로 작용할 수 있다. 이벤트(Events) 이벤트는 말 그대로 외부 세계에서 발생한 어떠한 현상이다. 이벤트를 정의할 때 가장 중요한 점은, 이것이 단순히 일상적으로 일어나는 별 거 아닌 일들인지, 아니면 여러 객체에 영향을 미치고 변화를 가져오는 중요한 일인지 구분하는 것이다. 후자, 즉 여러 객체에 영향을 미치고 변화를 가져오는 중요한 이벤트는 객체로 인식할 수 있다. 그래서 이벤트는 객체로 인식될 자격이 있는 중요한 것들만 유의미하고 중요하다. 이벤트가 객체가 될 수 있다는 설명은 처음 객체를 설명할 때부터 하면 시작부터 헷갈릴까봐 이렇게 따로 뺐다. 하지만 우리가 다룰 이벤트는 '객체가 될 자격이 있는 중요한 이벤트'들 뿐이므로 이벤트는 사실 객체에 속한다. 모든 이벤트가 객체가 될 수 있는 것은 아니지만, 우리가 다루는 것들은 객체인 이벤트들 뿐이다. 이렇게 객체로 인식될 자격이 있는 중요한 이벤트의 기준은 일반적으로 아래와 같다. 데이터 세상에서 '어떤 사건'이 발생했을 때, 그것이 세상에 단 하나뿐인 사건임을 증명하는 고유 번호가 필요하다. 그러기 위해서는 이벤트의 "시간"이 특정되어야 한다. 가령, 금리인상이라는 이벤트가 객체가 되기 위해서는 이벤트의 타임라인을 특정할 수 있어야 한다. 지금까지 수많은 금리인상 이벤트가 있었기 때문에 "Fed의 금리인상 20250905" 이런식으로 시점이 특정되어야 고유한 객체로 구분이 될 수 있다. 또한 연준 이사회(Federal Reserve Board)의 공식 API 또는 FRED(세인트루이스 연준 경제 데이터)의 시계열 데이터셋이라는 데이터 출처가 있어야 한다. 이렇게 말하면 이해가 잘 안가지만, 말하면 바로 이해할 수 있는 이벤트가 있다. 바로 2008년 금융위기이다. 이것은 분명히 존재감이 있는 객체로써 존재한다. 명확히 정의할 수는 없지만 2007년 즈음 부터 시작해서 2009~10년쯤에 마무리되었다는 명백한 타임라인도 가지고 있다. 모델(Models)/액션(Actions) : 물리엔진 가장 중요한 것은 이 모델과 액션이다. 이것은 이른바 게임의 물리엔진이다. 그리고 내가 생각했을 때 앞의 네가지에 비해 가장 압도적으로 정의하기 어렵다. 그리고 이 가상세계에서 가장 중요하다. 가령 모델이란 "연준이 FOMC에서 금리동결 예상을 깨고 25bp 인상 했을 때, 금가격에는 어떤 영향을 얼마나 미칠것인가?"에서 "얼마나"를, 그 계수를 규정하는 것이다. 사실, 위의 오브젝트들을 만들고 속성을 부여하고 관계를 규정하는 것들은 LLM의 도움을 받으면 그렇게 어려운 일들은 아니었다. 그러나 나는 팔란티어 프로젝트를 진행하면서 이 부분에서 가장 큰 벽을 느꼈다. 그리고 이 "영향을 얼마나"라는 파라미터값을 설정하는 부분이야 말로 금융시장의 추론에 있어서 오메가이자 알파겠구나 라는 부분을 본능적으로 체감할 수 있었다. 그리고 이부분이 바로 주인장님이 매일 연습하라는 시나리오와 확률배정과 맞닿아 있었다. 연준이 금리를 올렸을 때 금가격이 어떻게 얼마나 변동할 것인지는 단순히 과거에 금리를 인상했을 때 금가격이 당일 얼마가 올랐는지 내렸는지를 기준으로 추정하면 안되고, 그 때 당시의 여러가지 경제적 맥락(Context)과 지정학적 구도 등 여러가지 요소가 중요해진다. 이 액션이라는 물리엔진을 구현할 때, 대부분 가장 많이 쓰는 방법은 크게 세가지로 보인다. 순전히 LLM의 추정에 의한 부여 과거 비슷한 이벤트들을 분석,참조하여 통계적 확률을 부여 위 두가지를 섞은 하이브리드 방식 순전히 LLM의 추정에 의한 부여 순전히 LLM의 추정에 의한 부여란, 그냥 LLM에게 확률값을 물어보는 것이다. Gemini나 ChatGPT나 클로드에게 "만약 다음달 FOMC에서 연준이 금리인하를 할 확률은?"이라고 물어보면 대표적인 반응은 다음과 같다. 가장 먼저 굉장히 두루뭉술하게 대답하면서 구체적인 확률에 대한 답변을 회피한다. 그래도 집요하게 물어보면 마지못해 임의의 숫자를 내뱉는다. 물론, 2번에서도 완전히 말도 안되는 임의의 숫자를 내뱉지는 않는다. 가령 금리인하 확률이 막 99%입니다. 이렇게 맥락도 알아보지 않고 내뱉지는 않고 나름의 인터넷 웹상의 문서들을 읽어보고, 사전학습한 지식들을 조합해서 숫자를 내뱉어준다. 그러나, 그것이 엄밀하게 현재 가지고 있는 정보를 바탕으로 확률을 열심히 추정했다고 보기에는 조금 무리가 있다. 그리고 사람이 대충 한 45%? 이렇게 대충 뱉는 숫자에 비해 추정력이 높지는 않다는 점도 사실이다. 내가 추측한 그러한 이유는 크게 두가지가 있는데 첫째는 LLM에게 이런 것들을 물어볼 때마다 맥락(Context)없이 새로 데이터를 뒤지며 처음부터 리서치를 하기 시작하는데, 그렇게 리서치 할 수 있는 양이 제한된 답변시간 내에 한계가 있기 때문이고 둘째는 인터넷상에서는 데이터가 정형화되어 있지 않기 때문이다. 내가 위에서 팔란티어 프로젝트를 구상하기 시작한 이유도 바로 이 부분 때문이었다. 어라? 그냥 LLM에게 질문할 때 보다 내가 파일을 직접 던져주고 그 안에서 답변을 강요하는 NotebookLM을 사용하면 거짓말도 줄어들고 답변도 더 잘하네? 그럼 만약 LLM에게 표준화, 정형화된 데이터(객체, 속성, 관계, 액션)를 던져주고 이 안의 데이터만 이용해서 미래를 추정해봐라고 강요하면 더 정확한 답변이 가능하지 않을까? 이런 생각이 들었기 때문이다. 과거 비슷한 이벤트들을 분석,참조하여 통계적 확률을 부여 그냥 단순히 LLM에게 물어보는 것 보다는 과거 사례로 정량적인 통계적 확률을 부여한다는 점에서 좀 더 신뢰할만 할 수 있다. 그러나 이 경우 위에서 언급한대로 그 때 당시의 여러가지 경제적 맥락(Context)과 지정학적 구도 등 여러가지 요소가 중요해진다. 다른 맥락에서는 다른 자산가격 반응이 일어나는데, 이것을 어떻게 엄밀하게 규정할 것인지가 문제가 된다. 그리고 주인장님이 늘 귀에 닳도록 말씀하시지만, 매크로 추정에서는 데이터포인트의 시계열이 주, 월단위기 때문에 표본이 적어 통계적 유의미성이 떨어진다는 부분도 문제가 된다. 위 두가지를 섞은 하이브리드 방식 1번과 2번을 섞는 것이다. 통계적 확률을 참고하되, 사람의 영역인 연역적 추론을 LLM에게 외주주는 것이다. 과연 LLM이 추론이 가능한지 여부는 별론으로 한다. 이것이 주인장님이 말하는 모든 사이클은 닮아있다, 그 차이점 빼고는이라는 말과도 비슷하다. 과거에 일어났던 반응을 참고하되, 연역적으로 과거와 다른 부분을 감안하여 미래를 추정한다. 2. 내가 하고 싶었던 것 그래서 결국 나는, 이 복잡한 세계를 저렇게 다섯 가지(객체, 속성, 관계, 이벤트, 액션)로 구분하고 모델링하고자 했었다. 실시간 뉴스데이터 수집을 통해 이벤트 발생을 감지 이벤트가 식별가능 하고, 여러 객체에 영향을 미치는 중대한 사건이라고 판단되면 객체로 격상 객체로 격상되었으므로 속성을 부여 이벤트의 영향을 받을 것으로 추정되는 객체(기업 혹은 인물 등)와 이벤트간에 관계 노드를 형성 발생한 이벤트를 사전에 모델링된 액션함수에 따라 관계 노드를 타고 영향이 순차적으로 퍼져서 영향을 받는 객체들의 속성값을 어떻게 변화시킬 것인지 추정하도록 지시 비스무리하게 나오긴 하는데... 생각보다 가야할 길이 멀어보인다. 결국 기승전 물리엔진인 액션 함수에서 벽에 막혀서 고민하다보니... 어딘가 기시감이 들었다. ??? 이게 Cerefin AI 아냐? 3. Cerefin AI 오늘 때마침 Cerefin AI를 이용한 실시간 내러티브 기능이 론칭했다. 실시간 내러티브란? 시장의 주요 이벤트를 내러티브 단위로 묶어 타임라인 형태로 정리하고, 각 이벤트의 인과관계와 맥락을 설명하는 그래프로 시각화해 보여주는 기능입니다. 이를 통해 개별 뉴스가 1) 어떤 테마에 속해 있는지, 2) 어떤 흐름 속에서 등장했는지, 3) 가능한 미래 시나리오는 무엇이 있는지 등을 시장 관점에서 한눈에 파악하실 수 있습니다. 예를 들어, "메모리 가격 상승은 계속될까?"라는 내러티브가 시장에 형성되어 있다면, 메모리 가격과 관련된 뉴스를 하나의 타임라인으로 묶어 흐름을 따라가며 내러티브의 전개 방향을 확인하실 수 있습니다. 또한 카드를 클릭하면, 해당 이벤트와 연결된 이슈들의 요약·상세 설명·인과관계 그래프를 확인할 수 있으며, 이를 바탕으로 전개 가능한 미래 시나리오까지 함께 살펴보실 수 있습니다. 들어가보면 아래와 같이 타임라인에 따라 이벤트들의 논리흐름을 규정하고, 끝단에 가면 미래 시나리오 확률분포를 추정한다. 나는 Cerefin AI가 과연 이 내가 생각한 액션함수 즉, 물리엔진을 어떻게 설계해서 확률추정에 이르렀는지가 상당히 궁금해졌다. 물론 이 부분은 뉴로퓨전이 몇년간 공들이고 특허까지 낸 기능인 만큼, 내가 궁금하다고 해서 뉴로퓨전이 답변을 해줘야 할 이유도 없다. 그래도, 경쟁사에서 모델을 훔쳐갈 만한 힌트가 되지 않는 선에서는 참 궁금하긴 하다. 순전히 LLM의 추정에 의한 부여값인지 과거 비슷한 이벤트들을 분석,참조하여 통계적 확률을 부여한 것인지 위 두가지를 섞은 하이브리드 방식인지 이 모두가 아니고 뉴로퓨전만의 완전히 새로운 로직이 있는 것인지 만약 4번이라면, 아니, 3번일지라도 이것이 Working한다고 하면... 아마 금융시장에서 뉴로퓨전이 한 획을 그을 수 있지 않을까 하는 생각을 조심스레 해본다. 결국, Cerefin AI는 팔란티어가 하려는 것을 금융시장에서 시도하고 있는 것 같다. 나같은 방구석 코딩 한줄도 못하는 문외한이 알 수 없는 액션(물리엔진) 구현 방법론들이 연구되었을 것이기 때문에 당연히 내가 풀지 못한 문제를 어느 정도 풀었을 거고, 프로덕트화하고 특허를 출원했을 거라 생각한다. 주인장님이, 뉴로퓨전이 하고자 하는 일은 정말 대단한 일인 것 같다. 그리고 대단한 일에 도전하고 있는 것 같다. (기습팬심) 무한한 응원을... P.S. 클로드 Opus 4.6이 초보자 입장에서는 얼마나 대단하냐면, 이 정도 초등학생 같은 질문 수준도 전부 해결해줍니다... 개떡같이 물어봐도 찰떡같이 대답하고 해결까지 해줍니다. 불과 1년전까지도 이 정도 코딩 성능은 상상도 못했습니다. 제가 초보라서 확실히 체감됩니다. 아래 글이 과장이 아닐 수도 있겠다고 느낍니다. 8천만 회 이상 조회수가 나온 AI 관련 글, Something Big Is Happening

GOAT

911GT3RS

2026.02.13