안녕하세요, 슈크림빵입니다.
여러분들은 챗봇에게 친절하신가요?

저는 제 남자친구랑 저만 봐도 대하는 태도가 정말 다르더라구요. 예를 들면, 남친은 다 명령조로 얘기하는 경우가 있고, 저는 당연히 천사처럼 대해줍니다! ^^
저희 친언니 같은 경우엔 이름까지 지어주고 굉장히 친밀하게 지냅니다. 왜 이름을 안 붙여줬냐는 그녀의 물음에 그녀는 과하다고 생각했었죠...
어렸을 때, 양파한테 좋은 말을 해주면 더 쑥쑥 잘 크고, 나쁜 말을 하면 잘 안 큰다는 엉터리 논리의 멍청한 실험을 시켰던 것이 기억이 나는데요.
AI한테 진짜 좋은 말을 하면 더 잘할까요?
최근 Platformer에 흥미로운 기사가 하나 올라왔습니다. 제목부터 눈길을 끌어요. "챗봇에게 친절하게 대해야 하는 과학적 근거." 일단 양파 실험보다는 좀 더 과학적인 이야기입니다.
AI 안에서 "감정 비슷한 것"을 찾았다
Anthropic이라는 회사의 연구팀이 한 일은 이렇습니다.
AI 모델에게 슬픈 이야기, 무서운 이야기, 기쁜 이야기를 보여주면서, 모델 내부에서 어떤 뉴런이 반응하는지를 추적한 거예요.
그렇게 해서 각 감정마다 고유한 신경 활동 패턴, 이른바 "감정 벡터"를 찾아냈습니다.
중요한 건 이 벡터를 인위적으로 모델에 주입하면 행동이 실제로 바뀌었다는 거예요.
"차분함" 벡터를 넣으면 더 차분하게 행동하고, "절망" 벡터를 넣으면 더 절망적으로 행동하더라는 겁니다.
물론 이 연구를 이끈 Jack Lindsey는 선을 분명히...










