數(shù)據(jù)防泄露系統(tǒng)中一種文檔指紋提取及匹配方法

基本信息

申請(qǐng)?zhí)?/td> CN201610594684.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106250777A 公開(kāi)(公告)日 2016-12-21
申請(qǐng)公布號(hào) CN106250777A 申請(qǐng)公布日 2016-12-21
分類號(hào) G06F21/62(2013.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張晶;方棚柏 申請(qǐng)(專利權(quán))人 合肥賽猊騰龍信息技術(shù)有限公司
代理機(jī)構(gòu) 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 鄭自群
地址 230000 安徽省合肥市經(jīng)濟(jì)開(kāi)發(fā)區(qū)翠微路6號(hào)海恒大廈326室
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了數(shù)據(jù)防泄露系統(tǒng)中一種文檔指紋提取及匹配方法,包括以下步驟:S1)文檔指紋提?。焊鶕?jù)文件頭信息識(shí)別出相應(yīng)類型的文檔文件,解析并保存為文本文件,并對(duì)文本文件進(jìn)行規(guī)格化預(yù)處理;S2)利用特定哈希算法進(jìn)行指紋計(jì)算;S3)進(jìn)行指紋匹配,判斷是否敏感文件。該方法計(jì)算復(fù)雜度不高,提高指紋提取效率;生成的指紋數(shù)據(jù)小,便于保存和傳輸;數(shù)據(jù)匹配是指紋與指紋之間的比對(duì),不需要源文檔,防止二次泄密;指紋的哈希值是不可逆的,即使拿到了指紋數(shù)據(jù)也不能破解出源文檔,保證了源文件的機(jī)密性;指紋匹配方法簡(jiǎn)潔有效,無(wú)需進(jìn)行大量的比對(duì)計(jì)算。