골드브루의 톡

OpenAI의 새로운 연구 논문: "언어 모델이 환각을 일으키는 이유"

핵심 주장: 언어 모델의 환각(hallucination)은 신비로운 현상이 아니라, 잘못 설계된 학습·평가 구조가 만들어낸 예측 가능한 결과

원인 분석:

- 사전 학습 단계에서 사실과 오류를 구별하지 못하면 통계적 압력에 의해 환각이 자연 발생

- 평가 구조가 "불확실할 때 추측"하는 모델에 더 높은 점수를 부여하도록 설계되어 환각이 강화됨

해결책: 새로운 평가 지표를 추가하는 것이 아니라, 현재 리더보드를 지배하는 기존 벤치마크의 채점 방식 자체를 수정해야 하며, 이는 기술적 문제인 동시에 사회적 합의가 필요한 사회기술적 과제