基于迭代擴(kuò)樣的財(cái)務(wù)粉飾與異常識(shí)別模型構(gòu)建方法

基本信息

申請(qǐng)?zhí)?/td> CN202110363136.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113065949A 公開(kāi)(公告)日 2021-07-02
申請(qǐng)公布號(hào) CN113065949A 申請(qǐng)公布日 2021-07-02
分類(lèi)號(hào) G06Q40/02;G06K9/62;G06N3/00 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張洪江;李巖;宋兵;朱啟功 申請(qǐng)(專(zhuān)利權(quán))人 河北雄安舜耕數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 上海新隆知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉蘭英
地址 071700 河北省保定市容城縣白洋淀大道錦泰花園A區(qū)1號(hào)樓3單元502室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于迭代擴(kuò)樣的財(cái)務(wù)粉飾與異常識(shí)別模型構(gòu)建方法,屬于對(duì)公信貸過(guò)程中的反欺詐、風(fēng)控的領(lǐng)域,其包括以下步驟:從全部樣本中選取原始異常樣本和正常樣本并確定分層變量,對(duì)正常樣本進(jìn)行抽樣配比得到初始樣本;根據(jù)初始樣本,設(shè)定樣本特征變量,利用隨機(jī)森林算法建立標(biāo)準(zhǔn)分類(lèi)模型作為基礎(chǔ)分類(lèi)模型;利用基礎(chǔ)分類(lèi)模型對(duì)全部樣本進(jìn)行預(yù)測(cè);根據(jù)預(yù)測(cè)結(jié)果得到半監(jiān)督迭代擴(kuò)充樣本和業(yè)務(wù)邏輯擴(kuò)充樣本;將半監(jiān)督迭代擴(kuò)充樣本、業(yè)務(wù)邏輯擴(kuò)充樣本與原始異常樣本混合后對(duì)正常樣本進(jìn)行抽樣配比得到最終訓(xùn)練樣本,進(jìn)行訓(xùn)練得到最終財(cái)務(wù)粉飾與異常識(shí)別模型。本發(fā)明能夠解決在傳統(tǒng)建模過(guò)程中因正負(fù)樣本不均衡引起的模型表現(xiàn)欠佳或普適性不高的問(wèn)題。