一種基于集成學(xué)習(xí)技術(shù)的高維度數(shù)據(jù)預(yù)測(cè)方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201910394269.5 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN110516818A | 公開(公告)日 | 2019-11-29 |
| 申請(qǐng)公布號(hào) | CN110516818A | 申請(qǐng)公布日 | 2019-11-29 |
| 分類號(hào) | G06N20/20;G06N3/12 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 劉江川;張聰;樊小毅;龐海天;楊洋;邵俊松 | 申請(qǐng)(專利權(quán))人 | 南京江行聯(lián)加智能科技有限公司 |
| 代理機(jī)構(gòu) | 北京翔甌知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 南京江行聯(lián)加智能科技有限公司 |
| 地址 | 210000 江蘇省南京市玄武區(qū)玄武大道699-1號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于集成學(xué)習(xí)技術(shù)的高維度數(shù)據(jù)預(yù)測(cè)方法,首先對(duì)原始高維數(shù)據(jù)進(jìn)行預(yù)處理,包括缺失值和異常值的處理、去除重復(fù)數(shù)據(jù)等;接著利用GBDT特征重要性方法進(jìn)行特征篩選,并利用遺傳算法進(jìn)一步優(yōu)化篩選結(jié)果,盡量在不改變?cè)继卣鞯那疤嵯聦?duì)數(shù)據(jù)集進(jìn)行降維;在此基礎(chǔ)上,本發(fā)明利用Stacking集成學(xué)習(xí)的思想構(gòu)建集成模型,對(duì)數(shù)據(jù)進(jìn)行回歸預(yù)測(cè),并評(píng)估方法的效果。本發(fā)明充分考慮了高維度數(shù)據(jù)多特征、小樣本的特點(diǎn),具有魯棒性強(qiáng)、精度高、泛化能力強(qiáng)的特點(diǎn),可以充分挖出出原始數(shù)據(jù)中的潛在規(guī)律,提供更加精細(xì)化的決策支持。 |





