一種金融電銷場(chǎng)景中對(duì)負(fù)樣本做消減的采樣方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202011393908.5 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN112463781A | 公開(公告)日 | 2021-03-09 |
| 申請(qǐng)公布號(hào) | CN112463781A | 申請(qǐng)公布日 | 2021-03-09 |
| 分類號(hào) | G06F16/215(2019.01)I;G06Q40/00(2012.01)I;G06F16/28(2019.01)I;G06Q10/06(2012.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 田興邦;何國濤;蒲瑤;李全忠 | 申請(qǐng)(專利權(quán))人 | 普強(qiáng)時(shí)代(珠海橫琴)信息技術(shù)有限公司 |
| 代理機(jī)構(gòu) | 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 湯東鳳 |
| 地址 | 100000北京市海淀區(qū)北清路四維圖新大廈F座二層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種金融電銷場(chǎng)景中對(duì)負(fù)樣本做消減的采樣方法,具體步驟為:從金融場(chǎng)景營銷的數(shù)據(jù)獲取客戶結(jié)構(gòu)化維度,將數(shù)據(jù)分為三個(gè)子集,分別占全量比為80%(A),10%(V),10%(T);對(duì)A數(shù)據(jù)子集的正例集做聚類;計(jì)算在所有類邊界外的V數(shù)據(jù)子集和T數(shù)據(jù)子集所有的正例個(gè)數(shù)和負(fù)例個(gè)數(shù);計(jì)算V數(shù)據(jù)子集的正反例個(gè)數(shù)比:V_r;T數(shù)據(jù)子集的正反例個(gè)數(shù)比:T_r;并計(jì)算D_r=|T_r?V_r|;將T數(shù)據(jù)子集所有邊界外的正/反例記錄為S_w;對(duì)每一維度值為數(shù)字的重復(fù)上面的計(jì)算,累記每一維度的邊界;將所有S_w聯(lián)集為S_all,計(jì)算S_all中的正例個(gè)數(shù),反例個(gè)數(shù);假設(shè)原本分類器對(duì)T數(shù)據(jù)子集的AUC值為auc,計(jì)算新的AUC值A(chǔ)UC_new。本發(fā)明所提出的方法為非隨機(jī)的,能準(zhǔn)確的將多數(shù)的樣例減少而同時(shí)控制少數(shù)的樣例的減少,因此能同時(shí)保證AUC不下降。?? |





