一種網(wǎng)站識別方法及識別系統(tǒng)

基本信息

申請?zhí)?/td> CN201810696532.1 申請日 -
公開(公告)號 CN108875060B 公開(公告)日 2021-02-26
申請公布號 CN108875060B 申請公布日 2021-02-26
分類號 G06F16/9535(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 余剛 申請(專利權(quán))人 成都映潮科技股份有限公司
代理機構(gòu) 成都創(chuàng)新引擎知識產(chǎn)權(quán)代理有限公司 代理人 向群
地址 610041 四川省成都市高新區(qū)天府大道中段666號2棟34層3406號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種網(wǎng)站識別方法及識別系統(tǒng),該方法包括:采集至少三個樣本網(wǎng)頁分別對應(yīng)的至少三個樣本網(wǎng)址和至少三個樣本源代碼;根據(jù)預(yù)設(shè)的至少兩個特征類型,從每一個所述樣本源代碼中解析出每一個所述特征類型對應(yīng)的特征值;根據(jù)解析出的每一個所述樣本源代碼對應(yīng)的各個所述特征值,構(gòu)建所述至少三個樣本網(wǎng)址對應(yīng)的隨機森林模型;還包括:獲取待識別網(wǎng)站網(wǎng)址;利用所述隨機森林模型確定所述待識別網(wǎng)站網(wǎng)址的網(wǎng)站類型。本方案能提高識別網(wǎng)站類型的準(zhǔn)確度。??