一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用
基本信息

| 申請(qǐng)?zhí)?/td> | CN201910342155.6 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN110197706B | 公開(公告)日 | 2021-08-27 |
| 申請(qǐng)公布號(hào) | CN110197706B | 申請(qǐng)公布日 | 2021-08-27 |
| 分類號(hào) | G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I | 分類 | 物理 |
| 發(fā)明人 | 羅寧政;蔡志平;孫文成;王明;劉海濱;黃克濤;胡健;黃浪 | 申請(qǐng)(專利權(quán))人 | 深圳市寧遠(yuǎn)科技股份有限公司 |
| 代理機(jī)構(gòu) | 長(zhǎng)沙國(guó)科天河知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 邱軼 |
| 地址 | 518000廣東省深圳市南山區(qū)南山街道東濱路4078號(hào)永新時(shí)代廣場(chǎng)2號(hào)樓11-12樓 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用,該方法包括獲取數(shù)據(jù)集;根據(jù)CatBoost模型擬合所有的類別集,獲取每個(gè)類別集的權(quán)重值W1;根據(jù)XGBoost模型擬合所有的特征數(shù)據(jù)集,獲取每個(gè)特征數(shù)據(jù)的重要性分?jǐn)?shù)W2;根據(jù)每個(gè)類別集的權(quán)重值W1及每個(gè)特征數(shù)據(jù)的重要性分?jǐn)?shù)W2,獲取每個(gè)項(xiàng)目的全局參數(shù)W=W1*W2;并對(duì)每個(gè)特征數(shù)據(jù)按照全局參數(shù)W由高到低進(jìn)行排序;根據(jù)SBS算法,每輪迭代刪除排名最差的特征數(shù)據(jù),并記錄剩余子集的均方差值MSE;獲取標(biāo)均差值MSE最小的剩余子集,作為最優(yōu)子集O輸出。用于解決現(xiàn)有技術(shù)中數(shù)據(jù)處理的實(shí)用性和準(zhǔn)確性不高等問題,基于數(shù)據(jù)內(nèi)部的聯(lián)系進(jìn)行層次化特征選擇,提高數(shù)據(jù)處理的實(shí)用性和準(zhǔn)確性。 |





