一種金融電銷場(chǎng)景中對(duì)負(fù)樣本做消減的采樣方法

基本信息

申請(qǐng)?zhí)?/td> CN202011393908.5 申請(qǐng)日 -
公開(公告)號(hào) CN112463781A 公開(公告)日 2021-03-09
申請(qǐng)公布號(hào) CN112463781A 申請(qǐng)公布日 2021-03-09
分類號(hào) G06F16/215(2019.01)I;G06Q40/00(2012.01)I;G06F16/28(2019.01)I;G06Q10/06(2012.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 田興邦;何國濤;蒲瑤;李全忠 申請(qǐng)(專利權(quán))人 普強(qiáng)時(shí)代(珠海橫琴)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 湯東鳳
地址 100000北京市海淀區(qū)北清路四維圖新大廈F座二層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種金融電銷場(chǎng)景中對(duì)負(fù)樣本做消減的采樣方法,具體步驟為:從金融場(chǎng)景營銷的數(shù)據(jù)獲取客戶結(jié)構(gòu)化維度,將數(shù)據(jù)分為三個(gè)子集,分別占全量比為80%(A),10%(V),10%(T);對(duì)A數(shù)據(jù)子集的正例集做聚類;計(jì)算在所有類邊界外的V數(shù)據(jù)子集和T數(shù)據(jù)子集所有的正例個(gè)數(shù)和負(fù)例個(gè)數(shù);計(jì)算V數(shù)據(jù)子集的正反例個(gè)數(shù)比:V_r;T數(shù)據(jù)子集的正反例個(gè)數(shù)比:T_r;并計(jì)算D_r=|T_r?V_r|;將T數(shù)據(jù)子集所有邊界外的正/反例記錄為S_w;對(duì)每一維度值為數(shù)字的重復(fù)上面的計(jì)算,累記每一維度的邊界;將所有S_w聯(lián)集為S_all,計(jì)算S_all中的正例個(gè)數(shù),反例個(gè)數(shù);假設(shè)原本分類器對(duì)T數(shù)據(jù)子集的AUC值為auc,計(jì)算新的AUC值A(chǔ)UC_new。本發(fā)明所提出的方法為非隨機(jī)的,能準(zhǔn)確的將多數(shù)的樣例減少而同時(shí)控制少數(shù)的樣例的減少,因此能同時(shí)保證AUC不下降。??