一種基于內(nèi)容的恐怖文本識別方法

基本信息

申請?zhí)?/td> CN201410171360.8 申請日 -
公開(公告)號 CN103942191B 公開(公告)日 2018-04-27
申請公布號 CN103942191B 申請公布日 2018-04-27
分類號 G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 胡衛(wèi)明;劉國旗;李兵 申請(專利權(quán))人 人民中科(山東)智能技術(shù)有限公司
代理機(jī)構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 宋焰琴
地址 100190 北京市海淀區(qū)中關(guān)村東路95號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于內(nèi)容的恐怖文本識別方法,該方法包括:首先,對需要識別的文本進(jìn)行預(yù)處理,以消除錯誤數(shù)據(jù)和冗余數(shù)據(jù)對識別結(jié)果的消極影響;其次,構(gòu)建基于內(nèi)容的文本分類器模型,該模型能夠分別利用文本標(biāo)題分類器和文本內(nèi)容分類器對文本標(biāo)題和文本內(nèi)容進(jìn)行獨(dú)立識別,然后將兩種識別結(jié)果進(jìn)行決策融合,最終得出識別結(jié)果;最后,將格式化后的待識別文本數(shù)據(jù)作為基于文本分類器模型的輸入,該模型的輸出即為文本的識別結(jié)果。該方法在實(shí)驗(yàn)數(shù)據(jù)庫上能夠取得良好的實(shí)驗(yàn)效果,其識別結(jié)果具有較高的可靠性和穩(wěn)定性。