網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202011433549.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112445771A 公開(kāi)(公告)日 2021-03-05
申請(qǐng)公布號(hào) CN112445771A 申請(qǐng)公布日 2021-03-05
分類(lèi)號(hào) G06F16/174(2019.01)I;H04L29/06(2006.01)I;G06F16/13(2019.01)I;G06F16/172(2019.01)I;G06F21/56(2013.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 肖勤勇 申請(qǐng)(專(zhuān)利權(quán))人 阿米華晟數(shù)據(jù)科技(江蘇)有限公司
代理機(jī)構(gòu) 北京致科知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李洪娟;魏紅雅
地址 215300江蘇省蘇州市昆山市玉山鎮(zhèn)登云路288號(hào)海創(chuàng)大廈C座12樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)一種網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該方法包括:獲取待處理文件;根據(jù)所述待處理文件,確定第一哈希值;根據(jù)所述第一哈希值,獲取目標(biāo)bloom過(guò)濾器的起始地址;若基于所述起始地址對(duì)應(yīng)的目標(biāo)bloom過(guò)濾器確定所述待處理文件不存在,則對(duì)所述待處理文件進(jìn)行存儲(chǔ),和/或?qū)λ龃幚砦募M(jìn)行安全檢測(cè)。通過(guò)將文件的哈希值映射到多個(gè)bloom過(guò)濾器的起始地址,基于文件的哈希值找到對(duì)應(yīng)的bloom過(guò)濾器,進(jìn)一步基于bloom過(guò)濾器實(shí)現(xiàn)對(duì)文件的去重,相對(duì)于現(xiàn)有的基于哈希表進(jìn)行去重,有效減少了內(nèi)存空間的占用。??