
OpenAI File search & retrieval API에 이어서 Gemini에서도 File search tool을 공개했다는 소식입니다.
LLM provider 간의 성능 경쟁이 다음 stage로 접어들었나 하는 생각이 듭니다.
이 관점에서 File search tool이라는 기능 출시가 중요한 함의를 지닌다고 보기 때문에 글로 정리해보았습니다.
전력효율 등 provider의 비용문제는 제껴두고 LLM 사용자 측면에서 살펴보겠습니다.
Stage는 제맘대로, 즉흥적으로 나누었습니다
2018년 즈음 gpt-1 논문이 발표되던 시절부터 한동안은 LLM 모델 자체의 벤치마크 지표를 가지고 경쟁했습니다.
당시 벤치마크 성능을 측정하던 방식은 대개 고정된 데이터셋에서 input 문장을 주었을때 output 문장 (또는 단어)을 얼마나 잘 맞추는지 보는 방식이었습니다. 언어는 그자체로 모호하며 구체적인 의미는 항상 맥락에 의존한다는 사실을 고려하면 (미래에) 실제 사용될 방식과는 괴리가 있었습니다. 똑똑한 사람도 맥락 없는 질문을 받으면 바보가 되니까요.
GhatGPT 등장 이후 여러 LLM provider가 뛰어들면서 Context-handling 경쟁으로 넘어왔습니다. 기본 대화앱에서도 사용자 정보와 대화기록을 적극적으로 활용해 hit-rate을 높이고자 노력하는 한편, 대규모의 맥락 정보가 존재하는 상황들 (Claude code & 코드베이스)에선 맥락 정보에 ...

RAG 시스템&파이프라인도 결국 관리형 서비스화(PaaS/SaaS)될 거라 봤는데, 빠르게 현실화되네요!

그러게요. 이렇게 착착 발전하는 모습을 지켜보는것도 참 재밌습니다