가짜 상관관계: PER과 미래 시장 수익률은 관련이 없다?

가짜 상관관계: PER과 미래 시장 수익률은 관련이 없다?

avatar
Isekai Quant
2024.08.31조회수 21회

주의: 해당 글은 수학적 엄밀함보다는 현상의 이해를 위해 적었기 때문에 직감적인 표현에 대한 선호도가 더 높다는 것을 미리 알립니다.


뭐? 월스트릿저널이 거짓말을 한다고?

이 글의 작성 동기는 얼마 전에 봤던 WSJ기사 때문입니다. 아니, 정확하게 말하면 해당 트윗에서 WSJ에서 쓰인 특정 그래프에 대한 열띤 토론이 있었는데, 그것을 보고 궁금해져서 좀 더 깊게 파보게 되었습니다.


먼저 문제의 그래프를 보겠습니다.

image.png

가로축은 월별 선행 주가수익비율 (forward PER), 세로축은 S&P500의 10년 수익률(연율화)이고 기간은 1988년 ~ 2014년 까지입니다. 그래프상 뚜렷한 선형관계가 있는 것처럼 보이며 PER가 낮으면 이후 10년 수익률은 높고 PER가 높으면 이후 10년 수익률이 낮은 것 같네요.


그러나 이 분석은 이 그래프에서 대부분의 데이터 포인트를 생성하는 데 중복 수익률이 사용되었다는 사실을 크게 무시하고 있습니다. 무슨 말이냐구요? 원래는 1988년부터 2014년까지 약 30년의 기간 동안 겹치지 않는 세 개의 10년 수익률이 존재합니다. 하지만 세 개의 관측점만을 사용하여 통계 연구를 할 수는 없습니다. 따라서 실무자들은 더 자주 표본을 추출하여 충분한 관측점들을 생성하게 됩니다. 해당 그래프의 경우, 매월 향후 10년 수익률을 기록한다면 (1988년 1월 ~ 1998년 1월, 1998년 2월 ~ 1998년 2월, 등) 인접한 달 사이에는 약 119개의 중복 기간이 존재할 것입니다. 하나 떨어져 있다면 118개, 그 다음에는 117개. 이런식으로 계속 중첩되는 기간들이 존재하는 시계열 데이터를 생성하게 되는 것이죠.


이제 이러한 관행의 결과가 해당 상황에선 통계적으로 정당화되지 않는다고 말하면 어떻게 될까요? 좀 더 구체적으로, 장기 수익률과 주가수익비율 사이에 통계적으로 유의미한 선형 관계가 있다는 주장이 유효하지 않다고 말하면 어떻게 될까요? 위의 그래프가 강한 상관관계를 암시하는 것처럼 보이고(심지어 인과관계라고 말하는 사람도 있겠죠), 낮은 밸류에이션이 향후 높은 수익률로 이어진다는 것이 사실로 받아들여지고 있기 때문에 제 말을 받아들이기 어려울 것입니다.


해당 게시물에서는 인터넷에서 대다수의 사람들이 생각하는 것과는 달리 주가수익비율과 장기 수익률 사이에 유의미한 관계가 있다는 것을 통계적으로 증명하는 것이 얼마나 어려운지를 보여드리고자 합니다.


이 글에서는 선행 주가수익비율 (forward PER) 대신 경기조정주가수익비율을 (CAPE) 사용할 것인데, 결론에 미치는 영향은 없으니 참고해주시길 바랍니다.


그래서 문제가 뭔데?

중복 관찰을 사용하여 데이터 포인트를 늘리는 관행은 회귀 계수 추정치의 분산이 줄어든다는 점에서 합리적입니다. 그러나 자기상관성이 짙은 독립 변수, 즉 시간에 걸쳐 높은 자기상관관계를 나타내는 독립 변수를 사용하는 경우에는 그렇지 않습니다. 일반적으로 배당 수익률, 장부가 대비 주가 비율등의 이동평균을 구해 평활화된 평가 지표로 수익률을 예측하려고 하기 때문에 금융에서는 자기상관성이 짙은 독립 변수가 자주 보입니다. 이 글에서는 이러한 변수를 지속적 변수라고 정의하겠습니다.


특히, 예일대 로버트 실러 교수가 개발한 지표인 경기조정주가수익비율(CAPE)을 사용하는 경우가 많습니다. 인터넷에는 CAPE와 장기 수익률(예: 10년, 20년, 30년 수익률) 간에 유의미한 상관관계를 보여주는 연구들이 많이 있습니다. 회귀 계수가 매우 유의하기 때문에 관계가 없다는 귀무가설(베타 계수가 0인 경우)을 기각할 수 있는 것이죠. 그러나 실제로 CAPE는 자기상관관계가 높은 시계열 변수로 통계적 추론과 관련된 심각한 문제를 일으킬 수 있습니다.




잠깐 스톱. 좀 더 천천히.

일단 이 글을 이해하기 위해 중요한 몇 가지 개념들에 대해 간단하게 짚고 넘어가는 시간을 가지겠습니다. 자기상관성과 시계열의 정상성 (Autocorrelation and Stationarity), 그리고 CAPE의 속성입니다.


만약 해당 개념들에 대해 익숙하시다면 바로 다음 섹션으로 넘어가 주시면 되겠습니다 (랜덤 워크와 가짜 상관관계).


자기상관관계 이해하기

금융 시장에 대해 이야기할 때 우리는 종종 주식 가격, 통화 가치, 심지어 금리 수준 등 미래의 추세를 예측하려고 합니다. 이러한 예측을 이해하는 데 도움이 되는 핵심 개념 중 하나는 자기상관관계(Autocorrelation)입니다.


자기상관관계의 핵심은 시계열 데이터, 즉 서로 다른 시점에 수집되거나 기록된 데이터에서 패턴을 찾는 것입니다. 구체적으로, 자기상관관계는 시계열의 현재 값이 과거 값과 얼마나 관련이 있는지를 측정합니다.


간단히 말해서, 자기상관관계는 다음과 같은 질문을 던집니다: “오늘의 값은 어제의 값에 얼마나 의존하는가?”


예시: 온도 이야기

매일 도시의 기온을 추적하고 있다고 상상해 보세요. 오늘이 더운 날이라면 내일도 더울 가능성이 높다는 것을 알 수 있을 것입니다. 반면에 오늘이 추우면 내일도 추울 가능성이 높습니다. 오늘의 기온이 어제의 기온에 따라 달라지는 이러한 관계를 우리는 자기상관관계라고 부릅니다.


금융 분야의 자기상관관계

주가, 금리, 심지어 경제 지표와 같은 많은 금융 시계열은 시간이 지남에 따라 패턴을 따르는 경향이 있기 때문에 금융 분야에서 자기상관관계는 매우 중요합니다. 이러한 패턴을 감지할 수 있다면 미래에 대한 더 나은 예측을 할 수 있습니다.

다음은 금융 분야에서 자기상관관계가 널리 퍼져 있는 몇 가지 실제 사례입니다:


  1. 주식 가격:

  • 모멘텀 효과: 주가가 상승하고 있는 종목의 경우 단기적으로 계속 상승하는 경우가 종종 있습니다. 이럴 때 오늘의 가격은 어제의 가격과 양의 자기상관관계가 있다고 얘기합니다. 투자자들은 때때로 이러한 모멘텀을 이용해 추세가 지속될 것으로 기대합니다.

  • 평균 회귀: 반대로 과거 평균에 비해 주가가 매우 높았던 경우 주가가 하락하기 시작하여 '평균' 또는 평균값으로 돌아갈 수 있습니다. 이는 음의 자기상관관계로 볼 수 있는데, 오늘의 높은 가격이 미래의 낮은 가격을 예측하는 것입니다.

  1. 금리:

  • 중앙은행 정책: 중앙은행이 설정하는 금리는 시간이 지남에 따라 점진적으로 변하는 경우가 많습니다. 중앙은행이 한 달에 금리를 인상하면 경제 상황이 크게 변하지 않았다면 다음 달에 다시 인상할 확률이 높습니다. 이러한 금리의 지속성은 일종의 자기상관관계입니다.

3. 경제 지표:

- 실업률: 실업률이 매달 감소하고 있다면 적어도 단기적으로는 이러한 추세가 지속될 가능성이 높습니다. 과거의 실업률 감소는 미래의 실업률 감소를 암시하는 자기상관관계가 작용하는 것입니다.


결론

자기상관관계는 시계열에서 과거 값이 미래 값에 어떻게 영향을 미치는지 이해하는 데 도움이 되는 기본 개념입니다. 금융에서는 주가나 금리와 같은 많은 금융 변수가 자기상관관계를 보이기 때문에 이 개념이 특히 유용합니다. 자기상관관계를 이해하고 측정함으로써 시장 행동에 대한 인사이트를 얻고 더 많은 정보에 입각한 재무 결정을 내릴 수 있습니다.


시계열의 정상성 이해하기

시계열은 평균, 분산(데이터가 평균에서 얼마나 퍼져 있는지), 자기상관관계(현재 값이 과거 값과 얼마나 관련이 있는지)와 같은 통계적 특성이 시간이 지나도 일정하게 유지되면 정상성을 가진다고 하거나 정적 시계열이라고 표현합니다. 간단히 말해, 추세나 계절 효과가 없으며 그래프에 표시할 때 “정적”으로 보입니다.


아래는 가상의 정적 시계열의 예시 그래프입니다.


output.png

출처: Chat GPT


회원가입만 해도
이 글을 무료로 읽을 수 있어요.

이미 계정이 있으신가요?로그인하기
댓글 3
avatar
Isekai Quant
구독자 48명구독중 13명
2nd life as degen quant.