안녕하세요. 다들 잘 지내셨나요? 오늘 신항식 교수님을 뵙고 왔습니다. 부탁드릴게 있어서 뵙자고 한건데, 부탁을 흔쾌히 들어주셨어요. 그래서 오늘 매우 행복합니다.(ㅎㅎ).
땀방울 속에서 마주한 스승의 뒷모습
국민문화연구소가 지금 공사를 하고 있어요. 건물이 몇십년 된거 같은데, 비오면 물이 새고, 그래서 세입자가 견디다가 도망쳤습니다. 곰팡이부터, 나무 썩은게 처리가 안되어서 냄새나고, 시멘트 벽돌 기둥도 멀쩡한지 걱정되요. 안전상의 문제로 기둥을 새로 세우거나, 벽돌과 시멘트를 다시 발라야 할것 같은데, 또 1층은 환기가 잘 안되던데, 주택 구조부터 좀 잘못된거 같습니다. 여러모로 걱정되지만 이건 기술자분들께서 알아서 하시겠죠…..
그저께 교수님께 뵈러가도 되냐고 약속을 잡았었어요. 공사감독 해야한다고 국민문화연구소에 일찍 부터 계실테니, 오라고 하시더라구요. 혹시 도와드릴 일 있냐고, 일찍 가야하냐고 여쭤보았습니다.
“교수님 일 많을까요? 가서 도와드려야하나요?”
아 인부님들 돈 받고 하시는거라 도와드리면 안된다.
“네 그럼 네시에 뵙겠습니다.”
응 그래라.
그래서 아무생각 없이 네시에 갔습니다. 근데 일하시는 분들만 계시고, 교수님이 안보이시는거에요? 찾는데 인부들이랑 땀 흘리며 같이 일을 하고 계십니다. (ㅋㅋ)
(‘정말 이러실 거 였으면 일찍 부르시지…..?’)
미안해서 저를 안 부르신 건지, 오늘이 첫 작업이였는데, 국민문화연구소가 돈이 없다고 인부님들을 딱 두분만 고용했나 봅니다. 그런데, 인부님들 연세가 교수님 보다 많습니다. 그래서 교수님도 옆에서 구경만 할 수 없어서 얽히셨나 봅니다. 속으로 이거 큰돈 쓰는 데, 두분이서 잘 만드실 수 있을까 걱정을 했습니다. 저희 집도 공사할때 업자를 썻었는데, 어떤 부분은 결국 아빠가 다 들어내고 다시 했었거든요. 제가 보기엔 인테리어 문제를 넘어서 기둥부터 잡아야 할 거 같은데요…..
그렇게 교수님 하던 일을 맡아, 한여름에 좀 거들었는데, 몇분만 일해도 땀이 주르륵 났어요. 깬 벽돌과 시멘트 드는 역할을 제가 했습니다. 그렇게 일을 하는데, 인부님이 그러십니다.
“학생 낼은 일이 더 많은데… 또 안오니?”
ㅋㅋ;; (인부님은 돈 받고 일하시는거 잖아요!’)
옆에서 교수님이 남에 소중한 아들에게 왜 그러냐고 웃으며 말씀하셨어요. 그렇게 40분 정도 시멘트 포대를 나르면서 일을 했습니다. 작업을 마치고 교수님이 온몸으로 땀을 흘리시길래. 카페에서 토마토 주스를 사드렸습니다. 교수님은 하루종일 일을 하셔서 입맛이 없어보였는데, 그래도 걸어서 이동하다가 쌀국수 집에 들어갔어요. 베트남 분들이 하는 곳이였는데, 좀 비싸긴 했지만, 깔끔하고 맛있었습니다. 저희가 첫 손님이였고, 사람들이 줄줄이 들어왔어요.
맨땅에서 LLM과 쌓아 올린 언어의 뼈대
이제는 제가 하는 일을 정말 소개시켜 드리자면, 저는 ‘번역기‘를 만들고 있었습니다.
일반적인 ai 번역은 문맥 저장이 안되어 시리즈로 번역을 하면, 거리가 멀어지거나, 권수가 달라졌을 때 단어 맥락이 통일이 안됩니다. 컨텍스트를 짧게 이해하는 번역은 1권에서의 단어와, 3권에서 같은 문장이지만, 다르게 번역이 된다는 것이지요. 이러한 경우에 소설문장이 스토리 전체를 관통하는 대사라면 달리되어 번역 대참사가 벌어지는 거예요. 그래서 책번역은 맥락과 의미를 정확하게 전달할 수 있는, 메모리 시스템을 만들어야 합니다. 구체적인 로직은 영업 비밀인데, 나름의 방식으로 llm 를 겹겹이 겹쳐 책을 번역하는 파이프라인을 만들었습니다. ai 랑 대화하면서 하나씩 구조를 구상했기 때문에 아마 기존에 학계에서 실험하는 이론이랑은 많이 다른 걸로 알고 있어요. 자료를 검색하니까. 26년 요즘 초기에 들어서 제가 한 방식이 연구가 진행되는 거 같더라구요. 저는 그런 것도 모르고 맨땅에서 ai와 기본적인 요소부터 대화하면서 만들고 있었습니다. 그래서 제가 만든건 평가 기준 자체가 다른데, 어차피 llm 이라는게 어떻게 설계해도 무작위성이 상존합니다. 또 언어라는건 명확한 평가기준이 없는데, 굳이 다른 사람들에게 논문으로 입증할 필요가 없으니 제 방식대로 설계하고 있었어요. 전문 번역가는 어떤 방법으로 임하는지를 ai 와 대화하면서 하나씩 로직을 개념화시키고 설계했습니다. 로직이 전부 완성된 건 아닌데, 고유한 개념구조를 만드는데도 몇달이 걸렸어요. 곧 실제 실험을 할건데, 퀄리티가 낮다면 다 갈아엎어야 하지만, 중간 단계는 나쁘지 않았습니다.
의탁하는 공부와 오롯한 연구자의 주체성
저는 깃허브, 오픈소스 이런걸 돌아다니지 않았는데, 보통 개발자들은 어떤 오픈소스가 있는지만 공부를 합니다. 개발자들 공부법을 보니까, 주식쟁이들이 주식공부하는거랑 똑같더라구요.
그동안 금융계 과장이라던가, 주식쟁이들이 공부한다는게 미국 월가에서 편찬한 최신 뉴스 샅샅이 훑으며, 그대로 이야기 하자나요. 근데, 뉴스도 미국 것만 보면 안됩니다. 영미권에서 편찬하는 뉴스는 거짓말이 대다수고, 그들이 바라는 욕심을 세상이 흘러가는 방향이라며 사실처럼 적어놓습니다. 그것에 익숙해지면 생각을 안하게 되고, 잘못된 시야로 조금씩 사고가 괴리되는데, 투자자들의 위치는 그 과정에서 이용되는 전위부대라고 할 수 있어요. 그래서 같은 사건을 국가마다 다르게 묘사하는데, 그 차이를 짚으면서 균형적인 정보를 수집하는게 올바른 언론인이 해야하는 일입니다. 제가 생각하기에 주식 정보 중에서 그나마 ...


