프리미엄
예측대회
투자분석
아카데미
커뮤니티
로그인Valley AI 시작하기시작하기
Valley Space인기
새로운 AI 시대의 전환 – 경험의 시대(The Era of Experience)
밸런스 투자일기내면의 복리

새로운 AI 시대의 전환 – 경험의 시대(The Era of Experience)

avatar
사슴벌레
2025.04.23조회수 100회
avatar
사슴벌레
구독자 426명구독중 426명
Cloud & Platform Engineer. 꼬마빌딩, 아파트, Crypto, 미국주식, 연금저축. 뇌피셜은 일기장에서 공개하고 있습니다. (fellow 전용 톡·아티클도 있습니다)

알파고(Alphago), 알파제로(AlphaZero) 프로젝트를 주도했던 구글 딥마인드의 수석 연구 과학자 David Silver와 현대 강화학습의 창시자 중 한 명인 Richard S. Sutton. 최근 이들이 발표한 논문 Welcome to the Era of Experience에서는 인공지능이 이제 새로운 전환점을 맞이했다고 말합니다.

Screenshot 2025-04-23 at 10.11.18 PM.png

ChatGPT에서 뽑은 요약본입니다.

🧠 요약: 새로운 AI 시대의 전환 – 경험의 시대(The Era of Experience)

이 논문은 AI 발전이 이제 인간 데이터 기반 학습에서 벗어나, ‘경험’을 통한 자율 학습 중심으로 전환되어야 한다고 주장합니다.


📌 핵심 주장

1. 인간 데이터의 한계

  • LLM(대형 언어 모델)들은 인간 데이터 기반 학습을 통해 광범위한 작업을 수행하게 되었지만,

  • 수학, 코딩, 과학 등의 영역에서는 인간 지식만으로는 한계에 도달해가고 있음.

  • 인간 지식 기반 학습만으로는 새로운 발견이나 초인간적 성능은 달성하기 어려움.


2. 경험의 시대 (The Era of Experience)

  • 자율적인 상호작용을 통해 AI가 스스로 경험을 축적하고 학습하는 방식이 중요해짐.

  • 예: AlphaProof는 기존 10만 개 수학 증명을 학습한 후, 스스로 1억 개 증명을 생성해 IMO 수상 수준에 도달.


🔄 경험 기반 AI의 특징

1. 스트림 기반 학습 (Streams)

  • 인간처럼 긴 시간에 걸쳐 누적되는 경험을 기반으로 학습하고 개선.

  • 예: 건강 모니터링 AI는 수개월 간 웨어러블 데이터를 분석해 맞춤형 피드백 제공.

2. 행동과 관찰의 확장 (Actions and Observations)

  • 인간과의 텍스트 상호작용에 국한되지 않고, 디지털 및 물리 세계를 직접 조작함.

  • 예: 원격 망원경 조작, 실험 장비 제어 등.

3. 보상의 변화 (Rewards)

  • 기존에는 인간 평가자 기준으로 보상을 제공했지만,

  • 이제는 실제 환경에서 측정된 수치(건강, 성능, 생산성 등) 기반 보상으로 대체.

  • 보상 함수도 사용자 피드백을 반영해 적응 가능해야 함.

4. 계획과 추론 (Planning and Reasoning)

  • 단순한 언어 추론에서 벗어나, 세계 모델(world model)을 구축해 행동의 결과를 예측하고 계획 수립.

  • 예: 체력 향상을 위해 다양한 옵션의 미래 결과를 시뮬레이션.


🤖 왜 지금인가?

  • 과거 시뮬레이션 기반 RL(알파고 등)은 뛰어난 성과를 보였지만, 실제 세계에는 적용하기 어려움.

  • LLM의 부상은 일반화에는 성공했지만, 자율성 및 새로운 지식의 발견 능력은 부족.

  • 최근에는 LLM과 RL을 융합하여 실제 환경과 상호작용하는 자율 에이전트의 기반이 마련됨.


🧩 향후 과제 및 영향

✅ 기대효과

  • 맞춤형 건강/교육/과학 에이전트의 출현.

  • 자율적인 과학 실험을 통한 기술 및 의학의 급속한 발전.

⚠️ 잠재적 위험

  • 일자리 대체, 해석 가능성 감소, 통제 어려움.

  • 하지만, 경험 기반 AI는 변화 감지 및 자가 수정 가능성 등 안전 측면에서도 유리할 수 있음.


🏁 결론

경험의 시대는 인간 데이터의 한계를 뛰어넘는 초인간적 AI ...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

Basic 7일 무료 체험 시작하기
이미 계정이 있으신가요?로그인하기
댓글 2개
avatar
꿈꾸자요
2025.04.23

재미있게 읽었습니다. 인간의 한계를 넘어선 AI라니... 신의 영역에 가까워 질 것만 같네요. NotebookLM도 신기하네요..

(수정됨)
avatar
사슴벌레
작성자
2025.04.23

LLM시대에서 경험을 축적하는 AI라니! 정말 세상이 빠릅니다~ NotebookLM, Google AI Studio 모두 아주 재밌고 훌륭합니다. 엔지니어 기반의 딱 구글같은 AI행보랄까요^^

내면의 복리 카테고리의 다른글

오래전 퇴사한 회사 방문 후 느낀 점 (이직이 필요한 순간, 내가 성장하고 있다는 징후)

오늘은 2016년에 퇴사한 회사의 부사장님을 몇 년 만에 만났다. 내가 가장 존경하는 사람 중 하나이고, 평생 연락하며 지내고 싶은 분이다. 재택근무 위주로 생활하다 보니 외출만으로도 흥분이 되는데, 테헤란로가 아닌 을지로라니! 강남에서는 느낄 수 없는 거리 풍경과 사람들을 보기만 해도 기분이 좋았다. 우리는 점심을 먹고 바로 사무실로 올라갔다. 부사장님 방에서 일과 삶, 그리고 내가 그동안 했던 투자 얘기까지 모두 털어놓았다. 이후 사장님께 인사드리고, 내가 근무하던 시절부터 지금까지 회사에 다니고 있는 동료 4명과도 따로 얘기를 나눴다. 넥슨을 퇴사한 후 다른 게임 스타트업에도 다녔지만, 어떻게 보면 현재 내 커리어의 시작점은 바로 이 회사였다. 지금 생각하면 부끄러워서 모두 지워버리고 싶을 정도로 하드 스킬과 소프트 스킬 모두 엉망이었다. 물론 나도 잘 안다. 퇴사한 사람이 회사를 방문하면 반가울 순 있지만, 굳이 시간을 들여 얘기할 정도로 흥미롭지는 않다는 것을 말이다. 그래서 사무실에는 들어가고 싶지 않았는데, 부사장님이 데리고 가서 공간 구경도 할 겸 간 것이었다. 지금은 당시 동료 ...
내면의 복리
2025. 04. 22
20
2
193
오래전 퇴사한 회사 방문 후 느낀 점 (이직이 필요한 순간, 내가 성장하고 있다는 징후)

멈추지 않는다

인간을 바꾸는 방법은 세 가지뿐이다. 시간을 달리 쓰는 것, 사는 곳을 바꾸는 것, 새로운 사람을 사귀는 것. 이렇게 세 가지 방법이 아니면 인간은 바뀌지 않는다. 새로운 결심을 하는 건 가장 무의미한 행위다. -오마에 겐이치 지금 나는 무언가를 소유하고 싶은 욕구가 없다. 사고 싶었던 카메라, 오디오, 캠핑 장비, 옷, 신발, 자동차를 살 수 있게 되었지만 관심이 사라졌다. 부자는 아니지만 마음만 먹으면 언제든 살 수 있게 되니 오히려 흥미가 떨어진 것이다. 천 원도 허투루 쓰지 않는 습관 때문일 수도 있지만, 이제는 어떤 모습으로 존재할지에 더 초점을 맞추고 있다 보니 이렇게 됐다. ​ 오래전부터 술과 담배를 하지 않는다. 매일 ...
내면의 복리
2025. 04. 15
13
10
117

2025년 연봉 통보 기념 투자 전략 점검 (주식, 부동산)

(쓰다보니 너무 긴 잡담성 일기가 돼버렸네요. 죄송합니다) 회사의 보상 사이클이 4월로 바뀐 첫해, 어제 매니저로부터 인상률을 미리 통보받았다. 5% 인상에 보너스 10% 중 회사분 25%는 0, 나머지 75%만 지급된다. RSU도 작년과 비슷한 수준으로 받게 됐다. 요즘 다른 회사 소식에 관심이 없어서 잘 모르지만, 한국 기업들도 평균 5% 인상이라는 이야기를 들었다. 스타트업이나 게임 업계는 양극화가 심하다고 한다. 3% 미만의 인상이나 연봉 동결이 있는 반면, 잘 나가는 게임 회사는 현금으로 인센티브를 지급하기도 한다고. 물론 회사 내에서도 팀과 조직마다 상황은 다를 것이다. 난 평범한 직장인일 뿐이다. 월급을 모아 큰 부를 이루거나 완벽한 노후 대비를 할 순 없다. 5% 연봉 인상에 실망하거나 기뻐하기보다는, 10년 전 연봉을 떠올리며 미래 화폐 가치 하락에 대한 두려움이 밀려왔다. 특히 부동산 투자 관점에선 이 소득 인상의 흐름을 매우 중요하게 생각한다. 이에 대해선 뒤에서 이야기하겠다. 주식 투자 지난번에 얘기했듯, 난 이제 회사 주식을 조금씩 매도해 다른 자산으로 옮기려는 계획을 갖고 있다. 언젠가 주가가 오를 거라는 막연한 기대를 하지 않겠다는 의미다. 문제는 2, 5, 8, 11월 실적 발표 후 한 달 동안만 거래가 가능하다는 점이다. 지금 팔아서 많이 내려간 지수나 종목에 투자하고 싶어도 하지 못한다. 최근 꼬마빌딩을 매수하면서 큰 자금을 쏟았기에 여윳돈도 많지 않은 상태다. 적립식으로 투자하는 아내가 가진 약간의 돈으로 조금씩 더 매수하는 정도로 시장에 대응하고 있다. 어차피 나는 트레이더도 아니고, 일희일비하기보다는 큰 그림만 보려고 노력한다. 트럼프 때문이 아니더라도 금리 인상 효과는 올해 초중반까지 예상된 흐름 아니었던가. 조정장이 오리라고 예측할 수 있었지만, 예상치를 벗어난 최근의 큰 폭락 이후 언젠가 금리 인하 시그널이 나올 것이고, 그때는 주가의...
내면의 복리
2025. 04. 09
8
8

우리 부부의 투자 생활

저희 부부는 투자 초보입니다. 평생 돈, 투자가 무엇인지 모르고 살았습니다. 거두절미하고 지금 저희 부부의 투자 포트폴리오는 이렇습니다. 인플레이션 대비 & 레버리지 극대화 -> 부동산 투자 (재건축, 꼬마빌딩) 여유 자금으로 적립식 투자 -> 주식 (세상을 바꿀 회사, 필수소비재) 마켓사이클을 이용한 투자 -> 코인 (비트코인, 일부 알트코인) 분산투자 -> 자산운용사 활용 (연금저축계좌) ​비트코인은 2만 달러 전후로 매수를 시작해 9.5~10만 달러에 전량 매도 후, 최근 꼬마빌딩 매수하는데 보탰습니다. 업사이드 리스크 방지용으로 소액만 투자했지만 예상한 상승 사이클에 많이 올라줘서 수익실현을 했고, 부동산 자산에 리밸런싱 하였습니다. 내년 이후 저점 사이클이 오면 다시 매수할 계획입니다. ​ 분산투자는 공부하는 시간을 쓰기 싫어서 자산운용사에 맡기고 있습니다. 연금저축계좌를 활용하고 있고, 큰 욕심 없이 장기적으로 국민연금 수익률 정도만 돼도 매우 만족할 것 같습니다. ​ 주식은 여유 자금으로만 합니다. 가장 확실하고 안정적인 자산은 부동산이라는 생각이 강하고, 주식에 큰돈을 넣을 용기가 없어서 적립식으로 조금씩 투자합니다. 회사 대표를 꼼꼼히 분석한 후, 세상을 바꿀만한 회사에만 투자하고 있습니다. ​ 부동산은 수익률이 가장 좋은 ...
내면의 복리
2025. 04. 08
14
4

나의 경험을 공유하는 것은 나를 성장시키는 과정

3~4개월간의 빌딩 투자 여정을 지인들에게 공유했다. 약 50장의 슬라이드를 만들어서 2시간 가까이 화상미팅을 했다. 자랑을 하거나 강의를 하는 목적이 아니었다. 내가 겪은 시행착오와 팁을 모두 공개하고 자세히 설명했다. 빌딩은 큰돈을 투자해서 매수해야 하고 잘못하면 팔지도 못하고 장기간 고생할 수 있기 때문에, 앞으로 투자 계획 있는 분들이 실수 없이 성공 투자했으면 하는 마음이었다. 나로 인해 누군가가 작게라도 도움을 받았을 때 큰 보람을 느낀다. 마치 내가 개발하고 구축한 서비스에 만족해서 좋은 피드백을 들었을 때처럼 말이다. "건물 살 때 저렇게 해야 하는군요.", "진짜 빙의돼서 미리 사본 느낌", "열심히 하고 항상 베푸니 주변에서 도와주는군요.", "생생하고 흥미진진해서 나도 땀이 났다.", "자극 많이 받았다." 이전에는 이런 칭찬을 들으면 가면 증후군이 찾아왔지만, 이번에는 그런 증상 없이 순수하게 기쁜 마음이 들었다. 아마도 절실한 마음으로 열심히 노력했기 때문일 것이다. 또한 사람들과의 관계 형성과 소통이 더 자연스러워져 마음의 여유가 생긴 것도 한몫했을 것 같다. 짧게 준비해서 마련한 미팅이었지만, 나도 지식을 정리하고 인사이트를 성장시킬 수 있는 좋은 시간이었다. 준비한 슬라이드 마지막쯤에 추천 도서를 골라봤는데 가치관과 투자철학 정립에 큰 도움을 받은 책들이다. 긴장 풀지 않고 내일도 똑같이 생활하면서 또 다른 나의 경험을 공유해 줄 그날을 위해 꿈을 크게 품어본다.
내면의 복리
2025. 03. 20
15
2
멈추지 않는다
74
51
우리 부부의 투자 생활
32
나의 경험을 공유하는 것은 나를 성장시키는 과정