샘플사이즈가 굉장히 중요하다
특히 샘플사이즈가 작을때는 더 중요하다
그런데 이런 상황을 가정해보자
10분 전부터의 가격변화로 10분 후 가격변화를 예측해야 하는 과제:
그럼 11시 기준으로 할 때랑 11시 1분 기준으로 할 때랑
인풋아웃풋모두에 강한상관관계가 걸린다
그런데 여기서 통계적 도구를 적용하려고 보면(표준편차, 신뢰구간 등)
인풋에 상관관계가 걸려있으니 인풋간의 유사성이 클 확률이 높은데,
그럼 그 인풋들과 유사한 상황에서 그 데이터 두개를 예측에 사용하게 되면
(수학적으로 엄밀하지 않은 접근이지만 애초에 엄밀할 수가 없음)
아웃풋 두개가 독립적으로 결정되지 않았으므로
마치 그 인풋들과 유사한 상황에서 그 아웃풋을 지지하는 데이터가 2개인것 같은 착각을 ...

