AI의 '추론' 능력은 어디서 왔을까

안녕하세요, 슈크림빵입니다.🍩

오늘도 날씨가 맑네요. 저는 새벽 5시에 일어나서 사부작 거리다가 결국 오전에 기절해서 낮잠 2시간을 자고 난 후 개운하게 일어났습니다 ㅎㅎ 백수는 자유로운 영혼이죠

오늘은 "The Strange Origin of AI’s ‘Reasoning’ Abilities"라는 기사를 읽고 내용을 다뤄보겠습니다!

AI가 '생각한다'는 말, 어디서 시작됐을까

요즘 AI 뉴스를 보면 "추론 모델", "사고하는 AI" 같은 표현이 자연스럽게 등장해요.

OpenAI는 자사 모델이 "답하기 전에 생각한다"고 했고, Google도 "사고를 보여줄 수 있다"고 광고했죠.

이런 말을 듣다 보면 AI가 정말 무언가를 곰곰이 생각하는 것 같은 느낌이 드는데요.

The Atlantic에 실린 Alex Reisner의 최근 기사가 이 "생각하는 AI"의 기원을 추적하는데, 그 출발점이 좀 의외예요.

2020년 여름, 4chan의 게이머들이 AI Dungeon이라는 텍스트 RPG를 가지고 놀고 있었어요.

이 게임은 OpenAI의 GPT-3로 구동됐는데, ChatGPT 출시보다 2년도 더 전이라 모델이 간단한 산수조차 자주 틀리던 시절이었거든요.

그런데 게이머들이 게임 속 캐릭터에게 수학 문제를 "단계별로 설명하면서" 풀어보라고 시키자, 갑자기 정답률이 올라간 거예요.

심지어 캐릭터의 성격에 맞는 ...