프리미엄
예측대회
투자분석
아카데미
커뮤니티
로그인Valley AI 시작하기시작하기
Valley Space인기
Why Language Models Hallucinate?
적랑분석

Why Language Models Hallucinate?

avatar
적랑
2025.09.19조회수 35회
avatar
적랑
구독자 341명구독중 42명
논리 기반 사고

Why Language Models Hallucinate?

- Open AI & Georgia Tech 연구 팀 - 25.9.5.


https://openai.com/ko-KR/index/why-language-models-hallucinate/


저희가 LLM모델을 특히 금융에서 사용할 때 가장 주의해야할 점은 할루시네이션 현상일 것입니다. 사실이 아닌 일을 그럴듯하게 말하는 현상인데, 위 논문에서는 이러한 현상을 완벽히 줄일 수는 없다고 설명합니다. 저는 아는 만큼 보인다고 생각하는 사람으로써 할루시현상을 어쩔 수 없는 것으로 넘어가는 것을 넘어 왜 이러한 할루시현상이 일어나는지 알고 LLM 모델을 쓴다면 보다 LLM 활용도가 높아지지 않을까? 라는 생각으로 이 논문 내용을 공유하고자 합니다.


일단 할루시 현상이란 무엇을 말할까요? 언어 모델의 Hallucination이란 언어 모델이 불확실할 때 불확실성을 인정하기 보다는 추측하여 그럴듯하지만 틀린 진술을 생성하는 오류입니다.


이 오류가 생성되는 원인으로는 크게 Pre-training(사전 훈련) 영역과 Post-training(사후 훈련) 영역으로 나누어 설명하고 있는데 일단 구조적으로 통계 기반 모델이기 때문에 100% 정확성은 달성할 수 없다는 것 입니다.


통계 기반 모델이라 100% 정확성을 달성할 수 없다...? 이게 무슨 말일까요? 이걸 이해하기 위해서는 LLM이 단어 생성을 어떻게 하는 지에 대한 이해가 필요합니다. 많이...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

Basic 7일 무료 체험 시작하기
이미 계정이 있으신가요?로그인하기
댓글 1개
avatar
커다란곰
2025.10.14

유튜브 분할뇌 실험을 보면 좌뇌가 자연스럽게 거짓말을 만들어내는 게 llm 환각현상이랑 유사한 것 같던데, 이제 4살이 되어가는 저희 딸래미도 있지도 않은 사실에 대해 물어보면 자연스레 아무렇게나 지어내서 답하더라구요 llm의 특징을 보면 마치 발달하고 있는 뇌 같아서 신기합니다 ㅎㅎ

분석 카테고리의 다른글

FOMC 전 물가 및 고용 간략 정리

PPI 6월 PPI 0.0% (7.16. 발표)  기업들이 수입 관세로 인한 비용 증가분 중 일부를 흡수하고 있음 서비스 부분 (운송ㆍ창고) 하락에 따른 영향 (*관세로 인한 수입 활동 감소 반영) 7월 PPI 전월 대비 0.9% 상승하여 3년 만에 가장 큰 폭으로 상승 (8.14. 발표)  서비스 비용 급증이 주요 원인 PCE에 들어가는 구성요소 항공료(+1%), 포트폴리오 관리 수수료(+5.8%) 크게 상승 8월 PPI 전월 대비 0.1% 하락 (9.10. 발표) 최종 수요 서비스 가격이 0.2% 하락 식품, 에너지, 무역 서비스를 제외한 핵심 PPI는 0.3% 상승하여 4개월 연속 증가세 도ㆍ소매 마진이 1.7% 감소해 2009년 이후 최대폭 하락 PCE 관련 데이터: 포트폴리오 관리 수수료(+2.0%)와 항공료(+1.0%)는 견고한 상승세를 유지했으며, 의료 서비스 데이터는 상대적으로 온건 CPI 6월 CPI 0.3%, 근원 CPI 0.2% (7.15. 발표) 식품-에너지 제외 상품에서 관세 영향의 초기 신호가 감지 장난감, 가구, 가전제품, 의류 등에서 가격 상승이 일어남 ...
분석
2025. 09. 16
1
0
27

결국은 빅테크다....?

하나증권 리서치 중국/신흥국 전략 김경환님 글 발췌 •최근 Reddit, GitHub, X 등에서 다수의 개발자들이 Claude Code가 ‘지능이 떨어졌다‘고 대량으로 피드백. 가장 빈번한 불만은 “사용 제한이 눈에 띄게 강화됨”, “지연/타임아웃 및 연결 오류”, “컨텍스트 처리 문제”, “지시사항 준수 성능 저하” 등임 •이에 따라 많은 개발자들이 Claude 구독을 해지하고 OpenAI의 Codex로 이동하고 있으며, Codex 사용량은 지난 2주간 10배 급증했음 (중국언론) 위 글을 읽고 주변 지인들한테 물어보니 체감될 정도로 멍청해졌다고 하긴 하더라고요 위를 보고 든 생각은 결국 사람 당 GPU 사용량을 인위적으로 제한했을 가능성이 큰데, 제한한 이유는 아마 적자를 줄이려고 했을 거라 생각합니다 아마 아래 논리 중 하나겠죠 현재 LLM ...
분석
2025. 09. 11
3
0
58

단기 조정은 올까...?

요즘 증시는 신고점을 찍은 후 잠시 쉬어가는 장세를 보이고 있습니다. 단기 방향을 맞추기는 굉장히 어려워 보이고 월가 아재 역시 어느 쪽이든 50%대에서 다양한 요인들이 혼재되어 있는 형국이라고 말하고 있습니다. 다양한 리포트에서도 약 상승이 지속되어 보이나 단기 조정에 대비해야한다 등 위 아래 확실하게 말하고 있는 곳이 적은 형태인데, 월가 아재가 말했던 뷰는 아래와 같습니다. 관세 여파가 없었다면 상하단이 6350 - 6700인 채널에 안착 가능할 것 그러나 관세 전쟁 여파가 나타나기 시작한다면 이 채널선 레벨을 유지하기는 힘들 것 8~10월 사이에 단기 조정이 있을 가능성이 높고, 현재 밸류는 고평가로 생각됨 다만, 단기 조정 이후 유동성이 풀리면서 1년 가량 시장이 좋을 가능성 그 시장 속에서는, 이러나저러나 빅테크가 아닐까? 그러나 마지막으로 빅테크 실적마저 꺾이기 시작하는 시점이 버블이 터지는 시점일 가능성 사실 지금 제 개인 계좌는 단기 조정을 대비해 어느 정도 현금화를 하고 있습니다. 그런데, 현재 DB Gaps ...
분석
2025. 08. 12
4
0
119

확률론적 사고 (금융과 도박과의 관계 : Texas hold'em으로 설명)

월간 거장이야기 래리 하이트의 내용을 보고 한 번 글을 써보자는 생각이 들었습니다. 래리 하이트의 내용을 보고 감명을 깊게 받았다기 보다는 제가 포커라는 게임에 대해 공부하면서 느끼고 금융 시장에 접목하고자 하는 깨달음을 비슷하게 적용했던 사람이 래리 하이트일 수 있겠다고 생각했고 공유하고 의견을 들어보고자 이 글을 씁니다. 먼저 포커이론을 금융에서 접목시킬 수 있냐에 대한 의문이 들 수 있는데, 실제로 월가에서도 금융을 설명할 때 포커를 사용하는 모습을 종종 보고는 합니다. 많은 사람들이 읽었으리라 생각하는 피터린치의 '전설로 떠나는 월가의 영웅' 제 1부에도 관련 내용이 있는데 다음과 같은 내용입니다. '사실 주식시장을 보면 나는 스터드 포커가 떠오른다.' '매달 규칙적으로 스터드 포커를 하는 사람은 똑같은 '행운아'가 늘 돈을 번다는 사실을 깨닫게 된다. 이 행운아는 카드 패가 펼쳐질 때마다 확률을 조심스럽게 계산하고 또 계산해서 투자 수익을 극대화 하는 사람이다.' '스터드 포커 테이블에서나 월스트리트에서나 기적이 일어나는 일은 드물다. 잃는 사람은 계속 잃을 수 밖에 없다.' 위 내용은 월가의 영웅들 책 1부에 나오는 내용들로 스터드 포커는 해본적이 없지만 Texas hold'em에 대해 공부한 내용을 바탕으로 포커 게임의 이해도가 있다고 자부하는 사람으로써 맞는 말이라 생각합니다. 그리고 퀀트 트레이딩과 파생상품에 강점을 두는 투자 회사인 'Susquehanna International Group(SIG)'에서는 내부 교육으로 poker game 이론을 설명하기도 한다고 합니다. 여기서 의문이 하나 들 수 있을 것입니다. 포커 게임은 그냥 도박이 아닌가? 네, 저는 그 말도 맞다고 생각합니다. 누구는 포커 게임을 도박이라 하고 누구는 도박이 아니라 합니다. 또 어느 지역에서는 합법이고 또 다른 지역에서는 불법이지요. 이는 '도박'이라는 것을 어떻게 정의하냐에 따라 달려있다고 생각합니다. 가장 광의의 의미에서는 '도박'이란 재물, 재산상의 이익을 걸고 서로 승부를 다투는 짓으로 이 정의에서는 당연히 포커 게임은 도박입니다. 허나 이 정의를 들이민다면 합법이긴 하지만 금융 역시 도박의 범주 내에 들어올 수 있다고 생각합니다. 돈이 왔다갔다 하는 일이고 손해를 보는 사람과 이익을 보는 사람 모두 있는 곳이니까요. (물론 제로섬 게임은 아니긴 합니다.) 그렇다면 도박이 아니라고 생각하는 사람들과 합법인 지역에서의 이유는 뭘까요? 위 피터린치가 언급한 내용과 관련이 있습니다. 룰렛 등과 같이 오로지 '운'에 의해 좌우되는 것이 아니라 '실력'을 기반으로 하는 게임이기 때문에 이것은 도박이 아니다. 도박은 오직 '운'만으로만 승부를 날 때를 도박으로 정의한다. 이러한 관점으로 본다면 도박이 아닙니다. 실력에 의해 좌우되는 게임이니까요. 포커게임이 왜 실력 게임인지에 대해서 까지 설명하자면 너무 길어질 거 같아서 여기까지만 하고 다음 얘기로 넘어가고자 합니다. 지금까지 말한 내용과 앞으로 말할 내용을 정리하자면 다음 문장들만 이해하면 됩니다. 포커는 실력에 의해 결정되는 게임이며, 장기적인 승리를 위해서는 확률론적인 사고가 필요하다. 그리고 이 확률론적인 사고를 금융 시장에 접목할 수 있다. 확률론적인 이야기에 대해 해보겠습니다. 확률에 대해 아예 모르는 사람은 무슨 도박에 확률이냐라고 생각할 수도 있지만 확률론은 애초에 도박과 밀접하게 관련된 학문입니다. 중간에 중단된 도박의 판돈을 어떻게 나눌 것이냐는 주제로 한 페르마와 파스칼의 편지를 기원으로 시작해 도박을 연구하는 과정에서 나온 이론들을 바탕으로 이후 베르누이, 라플라스 등이 확률론의 발전에 크게 기여했습니다. 최근 사례를 보면 퀀트에 막대한 영향을 끼친 에드워드 소프는 카드카운팅을 기반으로 카지노에게 유리하게 설계된 블랙잭 게임을 본인에게 유리한 확률로 ...
분석
2025. 03. 12
3
2
56
확률론적 사고 (금융과 도박과의 관계 : Texas hold'em으로 설명)