敏感詞檢測模型的訓(xùn)練方法和系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN201711096041.5 | 申請日 | - |
| 公開(公告)號 | CN110019795B | 公開(公告)日 | 2021-10-12 |
| 申請公布號 | CN110019795B | 申請公布日 | 2021-10-12 |
| 分類號 | G06F16/35(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 張鵬;張春榮 | 申請(專利權(quán))人 | 普天信息技術(shù)有限公司 |
| 代理機(jī)構(gòu) | 北京德琦知識產(chǎn)權(quán)代理有限公司 | 代理人 | 謝安昆;宋志強(qiáng) |
| 地址 | 100080北京市海淀區(qū)海淀北二街6號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種敏感詞檢測模型的訓(xùn)練方法和系統(tǒng),該方法包括:步驟A?1:將訓(xùn)練語料庫的樣本數(shù)據(jù)輸入第一BLSTM模型和第二BLSTM模型,將第一BLSTM模型和第二BLSTM模型的輸出輸入CRF模型,CRF模型輸出輸入文本的敏感詞識別結(jié)果;基于CRF的識別結(jié)果與輸入文本的標(biāo)記結(jié)果的差異,更新模型當(dāng)前參數(shù);步驟A?2:將訓(xùn)練語料庫的樣本數(shù)據(jù)輸入當(dāng)前第一BLSTM模型,將該第一BLSTM模型的輸出輸入CNN模型,CNN模型輸出輸入文本的字體識別結(jié)果;基于CNN的識別結(jié)果與輸入文本的字體差異,更新模型的當(dāng)前參數(shù)。本發(fā)明提供的敏感詞檢測模型訓(xùn)練方法和系統(tǒng),可以得到性能更好的敏感詞檢測模型,相比于傳統(tǒng)DFA算法,對敏感詞的檢測不受敏感詞詞庫限制,對異性字具備一定的檢測能力。 |





