AI한테 "잘하고 있어"라고 말하면 진짜 잘할까요?

AI한테 "잘하고 있어"라고 말하면 진짜 잘할까요?

avatar
슈크림빵
2026.04.17조회수 129회


안녕하세요, 슈크림빵입니다.


여러분들은 챗봇에게 친절하신가요?

image.png

저는 제 남자친구랑 저만 봐도 대하는 태도가 정말 다르더라구요. 예를 들면, 남친은 다 명령조로 얘기하는 경우가 있고, 저는 당연히 천사처럼 대해줍니다! ^^


저희 친언니 같은 경우엔 이름까지 지어주고 굉장히 친밀하게 지냅니다. 왜 이름을 안 붙여줬냐는 그녀의 물음에 그녀는 과하다고 생각했었죠...


어렸을 때, 양파한테 좋은 말을 해주면 더 쑥쑥 잘 크고, 나쁜 말을 하면 잘 안 큰다는 엉터리 논리의 멍청한 실험을 시켰던 것이 기억이 나는데요.


AI한테 진짜 좋은 말을 하면 더 잘할까요?


최근 Platformer에 흥미로운 기사가 하나 올라왔습니다. 제목부터 눈길을 끌어요. "챗봇에게 친절하게 대해야 하는 과학적 근거." 일단 양파 실험보다는 좀 더 과학적인 이야기입니다.




AI 안에서 "감정 비슷한 것"을 찾았다

Anthropic이라는 회사의 연구팀이 한 일은 이렇습니다.


AI 모델에게 슬픈 이야기, 무서운 이야기, 기쁜 이야기를 보여주면서, 모델 내부에서 어떤 뉴런이 반응하는지를 추적한 거예요.


그렇게 해서 각 감정마다 고유한 신경 활동 패턴, 이른바 "감정 벡터"를 찾아냈습니다.


중요한 건 이 벡터를 인위적으로 모델에 주입하면 행동이 실제로 바뀌었다는 거예요.


"차분함" 벡터를 넣으면 더 차분하게 행동하고, "절망" 벡터를 넣으면 더 절망적으로 행동하더라는 겁니다.


물론 이 연구를 이끈 Jack Lindsey는 선을 분명히...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

이미 계정이 있으신가요?로그인하기
댓글 18
avatar
슈크림빵
구독자 89명구독중 12명
AI Engineer로 일하고 있습니다.