一種信貸變量數(shù)據(jù)的進行高緯變量篩選的方法

基本信息

申請?zhí)?/td> CN202111494508.8 申請日 -
公開(公告)號 CN114119211A 公開(公告)日 2022-03-01
申請公布號 CN114119211A 申請公布日 2022-03-01
分類號 G06Q40/02(2012.01)I;G06F17/18(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 鐘磊;田羽;劉銀龍;段笑;游江珊 申請(專利權(quán))人 武漢眾邦銀行股份有限公司
代理機構(gòu) 成都正煜知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李龍
地址 432200湖北省武漢市黃陂區(qū)盤龍城經(jīng)濟開發(fā)區(qū)漢口北大道88號漢口北國際商品交易中心D2區(qū)1-2層、22-23層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信用評分建模領(lǐng)域,提供了一種信貸變量數(shù)據(jù)的進行高緯變量篩選的方法。目的在于解決如何充分篩選高維變量,嘗試構(gòu)建一種新的變量篩選方法來輔助信用評分建模,確保得到的建模模型的最佳準(zhǔn)確度。主要方案包括獲取申請數(shù)據(jù)、放款數(shù)據(jù)、逾期數(shù)據(jù)、征信數(shù)據(jù);截取一段時間的數(shù)據(jù),根據(jù)cumauc歸納方法對提取的數(shù)據(jù)進行初步篩選,選取auc值大的數(shù)據(jù);對初步篩選的變量進行卡方分箱,卡方分箱使得每個數(shù)據(jù)有單獨的權(quán)重,為后續(xù)的評分模型引入非線性,降低了模型過擬合的風(fēng)險,選取權(quán)重較高的數(shù)據(jù);根據(jù)篩選得到的數(shù)據(jù)進行stepwise逐步回歸分析,最終得到所有的符合篩選條件的數(shù)據(jù)。