신파일러에 대해서





퇴근하고 버거 두개, 프라이, 제로 탄산 음료로 저녁을 해결했습니다. 운동 다녀와서 CPCU 진도 빼려구 책상에 앉았네요. 아침에 언론기사를 쭉 훑어보면서 출근 지하철에서 시간을 보내곤 하는데 포용적 금융의 맥락에서 중신용자에 대한 금융접근성을 높여야 한다는 것과 신용평가모델이 과거 데이터만 의존하고 편향 등으로 공정성과 상환능력의 예측력이 떨어진다는 결과적으로 현행 신용평가모델의 한계를 지적한 행정부의 고위 관료(경제학박사시더군요) sns 글에 관련된 내용을 다룬 언론기사가 생각 나더군요.
기술적 측면에서 데이터 사이언스 시각에서 접근하다보니 통계학과 기본적인 머신러닝 모델에 대한 논의만으로도 지적하신 바가 이해가 갔지만 관심이 가 찾다보니 관련 법학...






중저신용자들에 대한 위험평가가 잘 작동하지 않는 이유는 근본적으로 데이터의 부족입니다. 특히 씬 파일러들에게 적용되는 유효한 비정형 데이터가 극히 제한적입니다. 현 신용평가 모형의 시작점이 결국 예측변수를 부도나 불량으로 정의하고 통계 모형을 만드는 건데, 중저신용자에 대한 우대를 모형적으로 바꾸기 위해서는 방법론의 시작점부터 뜯어고쳐야 해서 사실 제한되는 부분이 많습니다. 그렇기에 정책적/정성적인 조작이 뒷단에 진행되는 방식으로 포용적 금융을 실행하는 경우가 대다수고요. 결국 데이터를 더 많이 확보해서 ml(비정형이 포함된다면 dl까지)로 모형을 개편하는 방법이 최선일텐데, 데이터 확보부터 (해당 데이터를 기업들이 팔지 않습니다) 병목이 생기며 확보하더라도 가공이 또 하나의 병목이기 때문에 근시일 내에 해당 문제가 개선되기는 어려워 보입니다. 특히 다양한 인터넷뱅크에서 해당 익스포져 타겟 대출상품을 내고 있으나 연체율 제어에 어려움을 겪는 등 상당히 난해한 문제입니다.

글 읽어주셔서 감사합니다. 실무 혹은 관련 과제를 다룬 연구를 하셨나보군요. 댓글 감사합니다. 계리사들도 위험 수준과 합리성을 갖는 보험료를 부과하는 문제를 다루는데 데이터 부족 할 때 적용되는 방법론이 신뢰도 입니다. 신뢰도의 개념을 논하기에 지면이 적절치 않지만 데이터가 부족할 때 부도나 불량을 예측하는 모형은 데이터가 부족 할 때 위험수준(미래 손실발생의 빈도와심도) 예측하여 보험료를 산정하는 모델과 동일한 본질을 다룬다고 생각되네요.