限定性神經(jīng)網(wǎng)絡機器翻譯方法及存儲介質

基本信息

申請?zhí)?/td> CN201810961909.1 申請日 -
公開(公告)號 CN109359304A 公開(公告)日 2019-02-19
申請公布號 CN109359304A 申請公布日 2019-02-19
分類號 G06F17/28;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 田亮;黎浩添 申請(專利權)人 新譯信息科技(深圳)有限公司
代理機構 深圳市輝泓專利代理有限公司 代理人 新譯信息科技(深圳)有限公司
地址 518000 廣東省深圳市南山區(qū)前海深港合作區(qū)前灣一路1號A棟201室(入駐深圳市前海商務秘書有限公司)
法律狀態(tài) -

摘要

摘要 一種限定性神經(jīng)網(wǎng)絡機器翻譯方法及存儲介質,包括下述步驟:1、訓練基本的NMT模型;2、使用該NMT模型翻譯一個即驗證集,并輸出ATTENTION LAYER里的詞對齊信息;3、使用詞性標注器進行詞性自動標注,然后利用詞對齊信息自動生成語料;4、把原本語料數(shù)據(jù)加上語料并重新訓練;5、使用替換功能時,把需要替換的詞先換成語料,進行解碼后,再利用詞對齊信息替換回去;6、完成UNK替換解碼過程。通過本發(fā)明可解決NMT對于UNK替換的技術效果不理想的缺點,針對性的流程可以大幅地增加替換的成功機率同時保持高質的翻譯質量,本發(fā)明應用了UNK替換功能,保證名詞翻譯的準確度。