一種降低敏感詞諧音匹配誤警率的文本審核裝置及方法

基本信息

申請(qǐng)?zhí)?/td> CN202011336483.4 申請(qǐng)日 -
公開(公告)號(hào) CN112434523A 公開(公告)日 2021-03-02
申請(qǐng)公布號(hào) CN112434523A 申請(qǐng)公布日 2021-03-02
分類號(hào) G06F40/284(2020.01)I;G06F40/30(2020.01)I;G06F40/253(2020.01)I;G06F16/33(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王曉平 申請(qǐng)(專利權(quán))人 上海極鏈科技發(fā)展集團(tuán)有限公司
代理機(jī)構(gòu) 上海碩力知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 林曉青
地址 202150上海市崇明區(qū)中興鎮(zhèn)汲浜公路39號(hào)21號(hào)樓1103室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種降低敏感詞諧音匹配誤警率的文本審核裝置及方法,該裝置包括:特定詞語單元替換模塊,對(duì)包含敏感諧音詞的待審核文本,將其敏感諧音詞替換為敏感詞原型,得到替換后的替換文本;分詞模塊,對(duì)待審核文本及替換文本進(jìn)行中文分詞處理,分別輸出分詞單元位置索引列表;語法單元一致性審核模塊,根據(jù)待審核文本及替換文本的分詞單元位置索引列表,進(jìn)行替換前后的語法單元一致性審核;詞性標(biāo)注模塊,對(duì)具有語法單元一致性的待審核文本及替換文本分別進(jìn)行詞性標(biāo)注處理;詞性標(biāo)注一致性審核模塊,對(duì)詞性標(biāo)注結(jié)果,比較特定詞語單元替換前后的詞語詞性;審核結(jié)果判斷輸出模塊,根據(jù)詞性標(biāo)注一致性審核模塊的審核結(jié)果進(jìn)行相應(yīng)的判斷處理。??