一種在類別樣本數(shù)量不均衡情況下的惡意樣本檢測方法
基本信息

| 申請?zhí)?/td> | CN202210187808.X | 申請日 | - |
| 公開(公告)號 | CN114548305A | 公開(公告)日 | 2022-05-27 |
| 申請公布號 | CN114548305A | 申請公布日 | 2022-05-27 |
| 分類號 | G06K9/62(2022.01)I;G06N20/00(2019.01)I;G06F21/56(2013.01)I;G06F8/53(2018.01)I;G06F17/18(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 劉洋;卞超軼;陳亙;金珂 | 申請(專利權)人 | 北京啟明星辰信息安全技術有限公司 |
| 代理機構 | 北京君泰水木知識產權代理有限公司 | 代理人 | - |
| 地址 | 100193北京市海淀區(qū)東北旺西路8號21號樓啟明星辰大廈102號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請?zhí)峁┮环N在類別樣本數(shù)量不均衡情況下的惡意樣本檢測方法,其步驟包括:對類別樣本數(shù)量不均衡的原始樣本進行特征提取,得到特征提取后的樣本作為訓練數(shù)據(jù);使用分類算法得到訓練數(shù)據(jù)的至少兩個分類預測結果;其中,所述訓練數(shù)據(jù)包括未標記數(shù)據(jù);設置采樣參數(shù)組集,所述采樣參數(shù)組集由若干采樣參數(shù)組構成,每個采樣參數(shù)組包括對訓練數(shù)據(jù)中各類別樣本進行采樣時使用的采樣參數(shù);將采樣參數(shù)組集中,使得所有分類預測結果之間相似度最高的采樣參數(shù)組作為最優(yōu)采樣參數(shù)組;根據(jù)最優(yōu)采樣參數(shù)組對訓練數(shù)據(jù)進行采樣。使用本申請能夠同時對多數(shù)類進行降采樣以及對少數(shù)類的進行過采樣,達到提高了檢測的泛化能力。 |





