신용정보원, 3700만명 개인정보 중 74만명 표본 추출
개인신용 외 기업신용, 보험신용 표본DB 등으로 확대

올해 상반기부터 대한민국 국민들의 신용정보를 공공 및 민간영역에서 다양하게 활용할 수 있는 표본DB가 본격적으로 제공된다.

한국신용정보원은 약 5000여개 금융기관에 집중되는 개인(이하 차주)의 식별정보, 신용거래정보, 신용도 판단정보, 신용능력정보, 공공정보 등을 포함한 개인신용정보 표본DB를 개발해 상반기 중 시범 서비스를 제공할 계획이다.

신용정보 표본DB는 최근 3년간 신용거래 경험이 있는 약 3700만명의 차주를 대상으로 층화추출방식에 의해 2% 수준에 해당하는 74만명의 표본을 추출해 구성했으며 차주정보, 대출정보, 연체정보 등 3개 테이블과 18개 항목으로 개발됐다.

해당 DB는 한국정보화진흥원의 K-ICT빅데이터 센터와 협력해 금융회사, 학계, 핀테크 기업 등 다양한 이용기관에 서비스를 제공하고 향후 기업신용, 보험신용 표본DB로 확대 개발해 2020년부터는 이용자가 원하는 데이터를 가공해 분석할 수 있는 맞춤형DB 서비스도 제공할 계획이다.

올 상반기부터 시범 서비스되는 신용정보 표본DB는 차주별 과거 37개월의 대출 및 연체 이력을 연결해 표본DB를 구성했다. 대법원에서 공고되는 채무재조정 정보는 분기단위까지, 대출일자는 최초 데이터 제공시점으로부터 20년 전, 연체발생일자는 최초 데이터 제공시점으로부터 7년 전 시점으로 값을 대체했다.

정보보안을 위해 개인이 식별할 수 없도록 비식별 조치를 수행하고 비식별 조치가 적정하게 수행됐는지 외부 전문검증단을 통해 검증하는 한편, 국세청 국세체납자 명단 등 공개 자료를 통해 재식별될 가능성을 없애기 위해 연체정보 중 공공정보의 연체등록금액은 모두 삭제했다.

한국신용정보원은 표본DB의 오차 범위를 줄이기 위해 매 분기마다 3개월치 월별 데이터를 추가하고 2년을 주기로 전체 표본을 재추출해 표본DB를 갱신해 제공할 예정이다.

또 이용자의 무분별한 DB 사용을 제한하기 위해 수혜자 부담 원칙과 실비 부담 원칙에 의거해 과금체계를 적용하고, 이용자에게 데이터를 직접 제공하는 방식이 아닌 가상의 분석환경에서 분석소프트웨어를 이용해 표본DB를 분석할 수 있는 원격분석시스템을 구축할 예정이다.

1단계로 개인신용정보 표본DB를 서비스 한 후 단계적으로 기업신용공여정보에 기반한 ‘기업신용정보 표본DB’와 보험계약 및 지급 정보를 기반으로 하는 ‘보험신용정보 표본DB’로 제공 범위를 확대할 계획이다.

한국신용정보원의 신용정보 표본DB 서비스는 금융산업 빅데이터 분석 활성화를 통해 금융산업 경쟁력 강화 및 금융 신산업 발전에 기여할 수 있을 것으로 기대된다.

한국신용정보원 관계자는 “금융회사들은 지금도 자사의 데이터를 신상품개발이나 신용평가모형 고도화 등에 활용하고 있지만 실질적으로 금융소비자의 금융활동에 대한 다양한 분석이 가능한 원시자료(Raw Data)를 구하기는 쉽지 않다”며 “데이터 분석 기반이 취약한 중소금융회사와 금융 스타트업이 신용정보 표본DB를 통해 리스크 관리, 신용평가모형 개선, 새로운 금융서비스 개발 등에 필요한 분석을 수행할 수 있게 되는 만큼 우리나라 금융산업의 경쟁력을 높일 수 있는 계기가 되길 바란다”고 말했다.

저작권자 © 대한금융신문 무단전재 및 재배포 금지