
안녕하세요, 슈크림빵입니다.🍩
오늘도 날씨가 맑네요. 저는 새벽 5시에 일어나서 사부작 거리다가 결국 오전에 기절해서 낮잠 2시간을 자고 난 후 개운하게 일어났습니다 ㅎㅎ 백수는 자유로운 영혼이죠
오늘은 "The Strange Origin of AI’s ‘Reasoning’ Abilities"라는 기사를 읽고 내용을 다뤄보겠습니다!

요즘 AI 뉴스를 보면 "추론 모델", "사고하는 AI" 같은 표현이 자연스럽게 등장해요.
OpenAI는 자사 모델이 "답하기 전에 생각한다"고 했고, Google도 "사고를 보여줄 수 있다"고 광고했죠.
이런 말을 듣다 보면 AI가 정말 무언가를 곰곰이 생각하는 것 같은 느낌이 드는데요.
The Atlantic에 실린 Alex Reisner의 최근 기사가 이 "생각하는 AI"의 기원을 추적하는데, 그 출발점이 좀 의외예요.
2020년 여름, 4chan의 게이머들이 AI Dungeon이라는 텍스트 RPG를 가지고 놀고 있었어요.
이 게임은 OpenAI의 GPT-3로 구동됐는데, ChatGPT 출시보다 2년도 더 전이라 모델이 간단한 산수조차 자주 틀리던 시절이었거든요.
그런데 게이머들이 게임 속 캐릭터에게 수학 문제를 "단계별로 설명하면서" 풀어보라고 시키자, 갑자기 정답률이 올라간 거예요.
심지어 캐릭터의 성격에 맞는 ...






재밌게 읽었습니다! 감사합니다!

몽사님 감사합니다! ㅎㅎ

좋은 글 감사합니다.

댓글 남겨주셔서 감사합니다~! 😊

안그래도 라벨링과 RLHF를 통해서 추론이 일어난다는게 이해가 안갔는데, 이 글을 보니 직관적으로 바로 이해가 되네요. "추론처럼 보이는 글을 예측"하는것이고 "풀이과정에서 제공된 맥락이 더 질좋은 정답으로 예측"된다는것.. 명쾌했습니다.

저도 chain of thought를 그냥 머리로만 이해했던거 같은데, 어디서부터 시작되고 예측 방향이 유도된다는 사실을 알게 되니 좀 이해가 되었습니다!
댓글 감사합니다!