一種基于內(nèi)容的恐怖文本識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN201410171360.8 申請(qǐng)日 -
公開(公告)號(hào) CN103942191A 公開(公告)日 2014-07-23
申請(qǐng)公布號(hào) CN103942191A 申請(qǐng)公布日 2014-07-23
分類號(hào) G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 胡衛(wèi)明;劉國(guó)旗;李兵 申請(qǐng)(專利權(quán))人 人民中科(山東)智能技術(shù)有限公司
代理機(jī)構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 宋焰琴
地址 100190 北京市海淀區(qū)中關(guān)村東路95號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于內(nèi)容的恐怖文本識(shí)別方法,該方法包括:首先,對(duì)需要識(shí)別的文本進(jìn)行預(yù)處理,以消除錯(cuò)誤數(shù)據(jù)和冗余數(shù)據(jù)對(duì)識(shí)別結(jié)果的消極影響;其次,構(gòu)建基于內(nèi)容的文本分類器模型,該模型能夠分別利用文本標(biāo)題分類器和文本內(nèi)容分類器對(duì)文本標(biāo)題和文本內(nèi)容進(jìn)行獨(dú)立識(shí)別,然后將兩種識(shí)別結(jié)果進(jìn)行決策融合,最終得出識(shí)別結(jié)果;最后,將格式化后的待識(shí)別文本數(shù)據(jù)作為基于文本分類器模型的輸入,該模型的輸出即為文本的識(shí)別結(jié)果。該方法在實(shí)驗(yàn)數(shù)據(jù)庫(kù)上能夠取得良好的實(shí)驗(yàn)效果,其識(shí)別結(jié)果具有較高的可靠性和穩(wěn)定性。