실행시마다 결과가 다르게 나왔던 문제
-> mongoDB에서 데이터를 가져오는 과정에서 파이프라인에서 타임스탬프로 정렬을 안해줘서 생긴 문제였다
결과값이 튀는 문제
-> 예측해야하는 인풋좌표에 대해
주변의 유의미한 좌표들이 한쪽으로 치우쳐져있다
유의미한 좌표들의 총 수가 적다
유의미한 좌표들이 서로 아주 가까히 이웃하여있다
이럴 때
프리딕션을 가중평균으로 하면 괜찮은데 가중선형피팅으로 해버리면
피팅하는 하이퍼플레인이 원점기준으로 저 멀리서 타이타닉마냥 기울어져 형성되고(2, 3 요인의 조합)
그게 1 요인에 의해서 기울기가 누적되서 이 모든 요인들의 환상의 하모니로 인풋좌표에서의 예측이 골로 가있는 건데
일단 지금은 테스트하느라 총데이터수가 적고 또 유효좌표도 그냥 전체좌표의 1%로 해놔서 이런거긴 하지만
평균대신 피팅을 쓸 때 장점이 주변에 참고할 데이터가 한쪽으로 쏠려있을 때 평균내는거에 비하여 예측값이 더 적절할 수 있다는 건데
오히려 그런 상황에서 문제를 일으킨 것이다.
근본적으로 데이터에 노이즈가 많은 것도 이유 중 하나이다.
또한 알고리즘에서 유의미한 ...

