一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用

基本信息

申請(qǐng)?zhí)?/td> CN201910342155.6 申請(qǐng)日 -
公開(公告)號(hào) CN110197706B 公開(公告)日 2021-08-27
申請(qǐng)公布號(hào) CN110197706B 申請(qǐng)公布日 2021-08-27
分類號(hào) G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I 分類 物理
發(fā)明人 羅寧政;蔡志平;孫文成;王明;劉海濱;黃克濤;胡健;黃浪 申請(qǐng)(專利權(quán))人 深圳市寧遠(yuǎn)科技股份有限公司
代理機(jī)構(gòu) 長(zhǎng)沙國(guó)科天河知識(shí)產(chǎn)權(quán)代理有限公司 代理人 邱軼
地址 518000廣東省深圳市南山區(qū)南山街道東濱路4078號(hào)永新時(shí)代廣場(chǎng)2號(hào)樓11-12樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用,該方法包括獲取數(shù)據(jù)集;根據(jù)CatBoost模型擬合所有的類別集,獲取每個(gè)類別集的權(quán)重值W1;根據(jù)XGBoost模型擬合所有的特征數(shù)據(jù)集,獲取每個(gè)特征數(shù)據(jù)的重要性分?jǐn)?shù)W2;根據(jù)每個(gè)類別集的權(quán)重值W1及每個(gè)特征數(shù)據(jù)的重要性分?jǐn)?shù)W2,獲取每個(gè)項(xiàng)目的全局參數(shù)W=W1*W2;并對(duì)每個(gè)特征數(shù)據(jù)按照全局參數(shù)W由高到低進(jìn)行排序;根據(jù)SBS算法,每輪迭代刪除排名最差的特征數(shù)據(jù),并記錄剩余子集的均方差值MSE;獲取標(biāo)均差值MSE最小的剩余子集,作為最優(yōu)子集O輸出。用于解決現(xiàn)有技術(shù)中數(shù)據(jù)處理的實(shí)用性和準(zhǔn)確性不高等問題,基于數(shù)據(jù)內(nèi)部的聯(lián)系進(jìn)行層次化特征選擇,提高數(shù)據(jù)處理的實(shí)用性和準(zhǔn)確性。