一種在類別樣本數(shù)量不均衡情況下的惡意樣本檢測方法

基本信息

申請?zhí)?/td> CN202210187808.X 申請日 -
公開(公告)號 CN114548305A 公開(公告)日 2022-05-27
申請公布號 CN114548305A 申請公布日 2022-05-27
分類號 G06K9/62(2022.01)I;G06N20/00(2019.01)I;G06F21/56(2013.01)I;G06F8/53(2018.01)I;G06F17/18(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉洋;卞超軼;陳亙;金珂 申請(專利權)人 北京啟明星辰信息安全技術有限公司
代理機構 北京君泰水木知識產權代理有限公司 代理人 -
地址 100193北京市海淀區(qū)東北旺西路8號21號樓啟明星辰大廈102號
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N在類別樣本數(shù)量不均衡情況下的惡意樣本檢測方法,其步驟包括:對類別樣本數(shù)量不均衡的原始樣本進行特征提取,得到特征提取后的樣本作為訓練數(shù)據(jù);使用分類算法得到訓練數(shù)據(jù)的至少兩個分類預測結果;其中,所述訓練數(shù)據(jù)包括未標記數(shù)據(jù);設置采樣參數(shù)組集,所述采樣參數(shù)組集由若干采樣參數(shù)組構成,每個采樣參數(shù)組包括對訓練數(shù)據(jù)中各類別樣本進行采樣時使用的采樣參數(shù);將采樣參數(shù)組集中,使得所有分類預測結果之間相似度最高的采樣參數(shù)組作為最優(yōu)采樣參數(shù)組;根據(jù)最優(yōu)采樣參數(shù)組對訓練數(shù)據(jù)進行采樣。使用本申請能夠同時對多數(shù)類進行降采樣以及對少數(shù)類的進行過采樣,達到提高了檢測的泛化能力。