一種WEB應(yīng)用系統(tǒng)敏感文字的檢測(cè)方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201310124839.1 申請(qǐng)日 -
公開(公告)號(hào) CN103279476B 公開(公告)日 2016-12-28
申請(qǐng)公布號(hào) CN103279476B 申請(qǐng)公布日 2016-12-28
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳劍鋒;楊永濱 申請(qǐng)(專利權(quán))人 深圳市易聆科信息技術(shù)股份有限公司
代理機(jī)構(gòu) 深圳市君勝知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市易聆科信息技術(shù)股份有限公司
地址 518057 廣東省深圳市南山區(qū)科技園中區(qū)高新中一道軟件大廈9樓910-912室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種WEB應(yīng)用系統(tǒng)敏感文字的檢測(cè)方法及系統(tǒng),該方法及系統(tǒng)對(duì)需要檢測(cè)的網(wǎng)站內(nèi)容進(jìn)行抓取和使用預(yù)設(shè)的敏感文字庫(kù)對(duì)網(wǎng)站內(nèi)容進(jìn)行敏感文字模糊檢測(cè);通過敏感文字語意分析對(duì)檢測(cè)出的敏感文字進(jìn)行分析,并將其進(jìn)行自動(dòng)分詞,生成敏感文字分詞列表;將該列表中的敏感文字分詞與敏感文字庫(kù)中的敏感文字進(jìn)行比對(duì)并再次進(jìn)行敏感文字模糊檢測(cè),形成最終敏感詞文字分詞列表,得出檢測(cè)結(jié)果。本發(fā)明提供的方法和系統(tǒng)可以自動(dòng)提取網(wǎng)頁內(nèi)容,并運(yùn)用敏感文字語意分析和模糊檢測(cè)等技術(shù),從而可以更好的進(jìn)行敏感文字的檢測(cè)及其信息的提取,為網(wǎng)站安全信息的維護(hù)提供方便。