프리미엄
예측대회
투자분석
아카데미
커뮤니티
로그인Valley AI 시작하기시작하기
Valley Space인기
AI 골드러시의 동력: 데이터센터와 전력 수요는 왜 폭발하는가?
적랑분석

AI 골드러시의 동력: 데이터센터와 전력 수요는 왜 폭발하는가?

avatar
적랑
2025.10.14조회수 158회

최근 AI 인프라를 담당하는 곳들의 주가가 널뛰고 있습니다. 이는 데이터센터 수요가 폭증했기 때문인데, 이에 관해 한 번 정리해보고자 합니다.


왜 이렇게 막대한 양의 데이터센터가 필요하고 전력이 필요할까요?


현재 왜 그렇게 GPU와 데이터센터에 대해 수요가 쏠릴까?에 대한 근본적인 부분을 살펴보면 다음과 같습니다. 최신 AI가 글을 잘 이해하고, 그림도 그리고, 심지어 코딩까지 하고 있는데 어떤 원리로 이렇게 똑똑해졌을지 살펴보면 그 거대한 발전의 비밀은 세 단계의 이야기로 이루어져 있습니다. '획기적인 공부법의 발견', '엄청난 공부량과 도구', 그리고 마지막으로 '성적이 오르는 마법 공식'의 발견입니다.


획기적인 공부법의 발견: '전화기 게임'에서 '오픈 북 시험'으로


과거의 AI(RNN)는 마치 '전화기 게임'처럼 공부했습니다. 첫 단어부터 순서대로 정보를 속삭이며 전달하다 보니, 문장이 길어지면 맨 처음의 내용이 점점 날아가는 문제가 발생했습니다.

RNN 계열 신경망 모델

하지만 2017년, 구글 연구진이 발표한 "Attention Is All You Need"라는 논문은 AI 분야의 모든 것을 바꿀 혁신적인 해법을 제시했습니다. "당신에게 필요한 것은 'Attention' 뿐이다"라는 제목은 그 자체로 하나의 선언이었습니다. 이는 더 이상 복잡한 순차 처리 방식 없이 오직 '어텐션' 메커니즘만으로 충분하다는 엄청난 자신감의 표현이었습니다.


이 논문에서 제안된 '트랜스포머(Transformer)' 구조는 그 이름처럼 AI의 패러다임을 완전히 전환시켰으며, 현재까지 약 20만 회 인용될 정도로 학계와 산업에 막대한 영향을 미치고 있습니다.


*GPT(Generative Pre-trained Transformer)

image.png
image.png


이 새로운 공부법은 '오픈 북 시험'과 같습니다. 정답을 찾아야 할 때, 책(문장 전체)의 모든 페이지(모든 단어)를 한 번에 펼쳐놓고, 문제와 가장 관련 있는 핵심 키워드에만 '집중(Attention)' 하는 방식입니다. 논문 제목처럼, 순차적인 정보 전달 없이 오직 'Attention'만으로도 충분하다는 것을 증명한 것입니다. 이 덕분에 AI는 아무리 긴 글이라도 핵심 의미를 놓치지 않게 되었습니다.

엄청난 공부량과 도구: 계산량 폭증과 해결사 GPU


이 '오픈 북 시험' 공부법은 효과가 확실했지만, 엄청난 노력이 필요했습니다. 모든 단어들이 서로 얼마나 관련 있는지 일일이 다 계산해야 했기 때문이죠. 글의 길이가 2배가 되면, 필요한 계산량은 4배로 폭증했습니다.

이 무지막지한 계산량을 감당하기 위해 나타난 해결사가 바로 GPU입니다. 똑똑한 박사님 한 명(CPU)이 순서대로 푸는 것보다, 수천 명의 일꾼들(GPU)이 단순 계산을 동시에 처리하는 것이 훨씬 빨랐습니다.

'오픈 북 시험(트랜스포머)'이라는 공부법과 '일꾼 군단(GPU)'이라는 도구가 준비된 것입니다.

성적이 오르는 마법 공식: '스케일링 법칙'의 발견


자, 이제 가장 중요한 마지막 단계입니다. 과학자들은 이 새로운 공부법과 도구를 가지고 실험하다가 놀라운 사실을 발견합니다. 바로 AI의 성적을 예측할 수 있는 '마법 공식'을 찾아낸 것입니다. 이 공식이 바로 '스케일링 법칙(Scaling Laws)'입니다.

이 공식의 세 가지 핵심 재료는 다음과 같습니다.

image.png
  1. 더 큰 두뇌 (모델 크기): AI의 뇌 용량(파라미터)을 늘려 더 복잡한 것을 배울 수 있게 합니다.

  2. 더 많은 교과서 (데이터 크기): 인터넷의 모든 글과 책을 읽게 하듯, 학습 자료를 늘려줍니다.

  3. 더 많은 공부 시간 (컴퓨팅 파워): 더 많은 GPU를 투입해 이 모든 것을 더 오래, 더 깊게 학습시킵니다.

스케일링 법칙의 진짜 마법은, 이 세 가지 재료를 늘리면 AI의 성능(성적)이 '얼렁뚱땅' 좋아지는 게 아니라, '예측 가능하게' 좋아진다는 점입니다. 마치 '수학 공부 시간을 2배로 늘리면 수학 점수가 10점 오를 거야'라고 미리 알 수 있게 된 것과 같습니다.


이 발견은 AI 개발의 패러다임을 바꾸었습니다. AI를 개발하는 것이 더 이상 '운'이나 '감'의 영역이 아니라, 막대한 자본 투자가 성능 향상으로 이어질 것이라는 '예측 가능성'을 제공하는 '공학'의 영역으로 들어선 것입니다.


이러한 예측 가능성의 핵심 근거가 바로 '스케일링 법칙(Scaling Laws)'입니다. 2020년 OpenAI 연구진은 모델 크기, 데이터양, 그리고 투입되는 컴퓨팅 파워를 늘리면 AI의 성능(손실 값)이 멱함수(power-law)에 따라 예측 가능하게 향상된다는 경험 법칙을 제시했습니다.


이 법칙은 이후 거대 언어 모델 개발의 핵심적인 나침반 역할을 했습니다. OpenAI는 GPT-4 기술 보고서에서, GPT-4 최종 훈련에 사용된 컴퓨팅 파워의 1/1000 미만으로 훈련한 소규모 모델들을 통해 GPT-4의 일부 핵심 성능을 사전에 매우 정확하게 예측했다고 공식적으로 밝혔습니다. '성공이 100% 보장'되는 것은 아니지만, 수조 원대 투자의 불확실성을 크게 줄여주는 강력한 근거가 된 셈입니다.


*GPT-2, 3, 4의 파라미터 수: 15억개 / 1,750억개 / 비공식 추정: 1조 8천억 개


이러한 예측 가능성은 빅테크 기업들의 천문학적인 AI 투자 경쟁에 불을 붙였습니다. 실제로 2025년 마이크로소프트와 구글은 AI 데이터센터 및 서버 확충을 위해 각각 약 800억 달러와 850억 달러에 달하는 대규모 투자 계획을 발표했습니다.


최신 AI의 발전 과정을 가장 정확하게 요약하면 다음과 같습니다.

'전화기 게임(RNN)'의 한계를 → '오픈 북 시험(트랜스포머)'으로 돌파하고 → 그 엄청난 계산량을 'GPU'로 감당하며 → '스케일링 법칙'을 통해 성능 향상의 예측 가능성을 확보하여 → 더 똑똑한 AI를 만들기 위한 거대 자본의 경쟁 시대가 열렸다.



훈련시장보다 훨씬 거대한 추론 시장


그리고 현재 AI 발전의 서사는 새로운 장에 접어들었습니다. '더 똑똑한 모델을 만드는' 훈련(Training)의 시대를 지나, 이제는...

회원가입만 해도
이 글을 무료로 읽을 수 있어요.

Basic 7일 무료 체험 시작하기
이미 계정이 있으신가요?로그인하기
댓글 1개
avatar
적랑
구독자 340명구독중 42명
논리 기반 사고
avatar
닭고기 요리
2025.10.14

와웅 잘 읽었습니다. 당신은 정리의 왕.. 굿이에여..

분석 카테고리의 다른글

Why Language Models Hallucinate?

Why Language Models Hallucinate? - Open AI & Georgia Tech 연구 팀 - 25.9.5. https://openai.com/ko-KR/index/why-language-models-hallucinate/ 저희가 LLM모델을 특히 금융에서 사용할 때 가장 주의해야할 점은 할루시네이션 현상일 것입니다. 사실이 아닌 일을 그럴듯하게 말하는 현상인데, 위 논문에서는 이러한 현상을 완벽히 줄일 수는 없다고 설명합니다. 저는 아는 만큼 보인다고 생각하는 사람으로써 할루시현상을 어쩔 수 없는 것으로 넘어가는 것을 넘어 왜 이러한 할루시현상이 일어나는지 알고 LLM 모델을 쓴다면 보다 LLM 활용도가 높아지지 않을까? 라는 생각으로 이 논문 내용을 공유하고자 합니다. 일단 할루시 현상이란 무엇을 말할까요? 언어 모델의 Hallucination이란 언어 모델이 불확실할 때 불확실성을 인정하기 보다는 추측하여 그럴듯하지만 틀린 진술을 생성하는 오류입니다. 이 오류가 생성되는 원인으로는 크게 Pre-training(사전 훈련) 영역과 Post-training(사후 훈련) 영역으로 나누어 설명하고 있는데 일단 구조적으로 통계 기반 모델이기 때문에 100% 정확성은 달성할 수 없다는 것 입니다. 통계 기반 모델이라 100% 정확성을 달성할 수 없다...? 이게 무슨 말일까요? 이걸 이해하기 위해서는 LLM이 단어 생성을 어떻게 하는 지에 대한 이해가 ...
분석
2025. 09. 19
2
1
35
Why Language Models Hallucinate?

FOMC 전 물가 및 고용 간략 정리

PPI 6월 PPI 0.0% (7.16. 발표)  기업들이 수입 관세로 인한 비용 증가분 중 일부를 흡수하고 있음 서비스 부분 (운송ㆍ창고) 하락에 따른 영향 (*관세로 인한 수입 활동 감소 반영) 7월 PPI 전월 대비 0.9% 상승하여 3년 만에 가장 큰 폭으로 상승 (8.14. 발표)  서비스 비용 급증이 주요 원인 PCE에 들어가는 구성요소 항공료(+1%), 포트폴리오 관리 수수료(+5.8%) 크게 상승 8월 PPI 전월 대비 0.1% 하락 (9.10. 발표) 최종 수요 서비스 가격이 0.2% 하락 식품, 에너지, 무역 서비스를 제외한 핵심 PPI는 0.3% 상승하여 4개월 연속 증가세 도ㆍ소매 마진이 1.7% 감소해 2009년 이후 최대폭 하락 PCE 관련 데이터: 포트폴리오 관리 수수료(+2.0%)와 항공료(+1.0%)는 견고한 상승세를 유지했으며, 의료 서비스 데이터는 상대적으로 온건 CPI 6월 CPI 0.3%, 근원 CPI 0.2% (7.15. 발표) 식품-에너지 제외 상품에서 관세 영향의 초기 신호가 감지 장난감, 가구, 가전제품, 의류 등에서 가격 상승이 일어남 ...
분석
2025. 09. 16
1
0
27

결국은 빅테크다....?

하나증권 리서치 중국/신흥국 전략 김경환님 글 발췌 •최근 Reddit, GitHub, X 등에서 다수의 개발자들이 Claude Code가 ‘지능이 떨어졌다‘고 대량으로 피드백. 가장 빈번한 불만은 “사용 제한이 눈에 띄게 강화됨”, “지연/타임아웃 및 연결 오류”, “컨텍스트 처리 문제”, “지시사항 준수 성능 저하” 등임 •이에 따라 많은 개발자들이 Claude 구독을 해지하고 OpenAI의 Codex로 이동하고 있으며, Codex 사용량은 지난 2주간 10배 급증했음 (중국언론) 위 글을 읽고 주변 지인들한테 물어보니 체감될 정도로 멍청해졌다고 하긴 하더라고요 위를 보고 든 생각은 결국 사람 당 GPU 사용량을 인위적으로 제한했을 가능성이 큰데, 제한한 이유는 아마 적자를 줄이려고 했을 거라 생각합니다 아마 아래 논리 중 하나겠죠 현재 LLM ...
분석
2025. 09. 11
3
0
58

단기 조정은 올까...?

요즘 증시는 신고점을 찍은 후 잠시 쉬어가는 장세를 보이고 있습니다. 단기 방향을 맞추기는 굉장히 어려워 보이고 월가 아재 역시 어느 쪽이든 50%대에서 다양한 요인들이 혼재되어 있는 형국이라고 말하고 있습니다. 다양한 리포트에서도 약 상승이 지속되어 보이나 단기 조정에 대비해야한다 등 위 아래 확실하게 말하고 있는 곳이 적은 형태인데, 월가 아재가 말했던 뷰는 아래와 같습니다. 관세 여파가 없었다면 상하단이 6350 - 6700인 채널에 안착 가능할 것 그러나 관세 전쟁 여파가 나타나기 시작한다면 이 채널선 레벨을 유지하기는 힘들 것 8~10월 사이에 단기 조정이 있을 가능성이 높고, 현재 밸류는 고평가로 생각됨 다만, 단기 조정 이후 유동성이 풀리면서 1년 가량 시장이 좋을 가능성 그 시장 속에서는, 이러나저러나 빅테크가 아닐까? 그러나 마지막으로 빅테크 실적마저 꺾이기 시작하는 시점이 버블이 터지는 시점일 가능성 사실 지금 제 개인 계좌는 단기 조정을 대비해 어느 정도 현금화를 하고 있습니다. 그런데, 현재 DB Gaps ...
분석
2025. 08. 12
4
0
119

확률론적 사고 (금융과 도박과의 관계 : Texas hold'em으로 설명)

월간 거장이야기 래리 하이트의 내용을 보고 한 번 글을 써보자는 생각이 들었습니다. 래리 하이트의 내용을 보고 감명을 깊게 받았다기 보다는 제가 포커라는 게임에 대해 공부하면서 느끼고 금융 시장에 접목하고자 하는 깨달음을 비슷하게 적용했던 사람이 래리 하이트일 수 있겠다고 생각했고 공유하고 의견을 들어보고자 이 글을 씁니다. 먼저 포커이론을 금융에서 접목시킬 수 있냐에 대한 의문이 들 수 있는데, 실제로 월가에서도 금융을 설명할 때 포커를 사용하는 모습을 종종 보고는 합니다. 많은 사람들이 읽었으리라 생각하는 피터린치의 '전설로 떠나는 월가의 영웅' 제 1부에도 관련 내용이 있는데 다음과 같은 내용입니다. '사실 주식시장을 보면 나는 스터드 포커가 떠오른다.' '매달 규칙적으로 스터드 포커를 하는 사람은 똑같은 '행운아'가 늘 돈을 번다는 사실을 깨닫게 된다. 이 행운아는 카드 패가 펼쳐질 때마다 확률을 조심스럽게 계산하고 또 계산해서 투자 수익을 극대화 하는 사람이다.' '스터드 포커 테이블에서나 월스트리트에서나 기적이 일어나는 일은 드물다. 잃는 사람은 계속 잃을 수 밖에 없다.' 위 내용은 월가의 영웅들 책 1부에 나오는 내용들로 스터드 포커는 해본적이 없지만 Texas hold'em에 대해 공부한 내용을 바탕으로 포커 게임의 이해도가 있다고 자부하는 사람으로써 맞는 말이라 생각합니다. 그리고 퀀트 트레이딩과 파생상품에 강점을 두는 투자 회사인 'Susquehanna International Group(SIG)'에서는 내부 교육으로 poker game 이론을 설명하기도 한다고 합니다. 여기서 의문이 하나 들 수 있을 것입니다. 포커 게임은 그냥 도박이 아닌가? 네, 저는 그 말도 맞다고 생각합니다. 누구는 포커 게임을 도박이라 하고 누구는 도박이 아니라 합니다. 또 어느 지역에서는 합법이고 또 다른 지역에서는 불법이지요. 이는 '도박'이라는 것을 어떻게 정의하냐에 따라 달려있다고 생각합니다. 가장 광의의 의미에서는 '도박'이란 재물, 재산상의 이익을 걸고 서로 승부를 다투는 짓으로 이 정의에서는 당연히 포커 게임은 도박입니다. 허나 이 정의를 들이민다면 합법이긴 하지만 금융 역시 도박의 범주 내에 들어올 수 있다고 생각합니다. 돈이 왔다갔다 하는 일이고 손해를 보는 사람과 이익을 보는 사람 모두 있는 곳이니까요. (물론 제로섬 게임은 아니긴 합니다.) 그렇다면 도박이 아니라고 생각하는 사람들과 합법인 지역에서의 이유는 뭘까요? 위 피터린치가 언급한 내용과 관련이 있습니다. 룰렛 등과 같이 오로지 '운'에 의해 좌우되는 것이 아니라 '실력'을 기반으로 하는 게임이기 때문에 이것은 도박이 아니다. 도박은 오직 '운'만으로만 승부를 날 때를 도박으로 정의한다. 이러한 관점으로 본다면 도박이 아닙니다. 실력에 의해 좌우되는 게임이니까요. 포커게임이 왜 실력 게임인지에 대해서 까지 설명하자면 너무 길어질 거 같아서 여기까지만 하고 다음 얘기로 넘어가고자 합니다. 지금까지 말한 내용과 앞으로 말할 내용을 정리하자면 다음 문장들만 이해하면 됩니다. 포커는 실력에 의해 결정되는 게임이며, 장기적인 승리를 위해서는 확률론적인 사고가 필요하다. 그리고 이 확률론적인 사고를 금융 시장에 접목할 수 있다. 확률론적인 이야기에 대해 해보겠습니다. 확률에 대해 아예 모르는 사람은 무슨 도박에 확률이냐라고 생각할 수도 있지만 확률론은 애초에 도박과 밀접하게 관련된 학문입니다. 중간에 중단된 도박의 판돈을 어떻게 나눌 것이냐는 주제로 한 페르마와 파스칼의 편지를 기원으로 시작해 도박을 연구하는 과정에서 나온 이론들을 바탕으로 이후 베르누이, 라플라스 등이 확률론의 발전에 크게 기여했습니다. 최근 사례를 보면 퀀트에 막대한 영향을 끼친 에드워드 소프는 카드카운팅을 기반으로 카지노에게 유리하게 설계된 블랙잭 게임을 본인에게 유리한 확률로 ...
분석
2025. 03. 12
3
2
56
확률론적 사고 (금융과 도박과의 관계 : Texas hold'em으로 설명)