一種適用于神經(jīng)網(wǎng)絡機器翻譯的漢語分詞方法及裝置

基本信息

申請?zhí)?/td> CN201911028104.2 申請日 -
公開(公告)號 CN110852099A 公開(公告)日 2020-02-28
申請公布號 CN110852099A 申請公布日 2020-02-28
分類號 G06F40/289;G06F40/216;G06F40/58 分類 計算;推算;計數(shù);
發(fā)明人 張孝飛;葛昱暉;陳莉莉;李帥;呂榮波 申請(專利權)人 北京中獻電子技術開發(fā)有限公司
代理機構 中科專利商標代理有限責任公司 代理人 鄢功軍
地址 100081 北京市海淀區(qū)氣象路50號中知大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及機器翻譯技術領域,尤其涉及一種適用于神經(jīng)網(wǎng)絡機器翻譯的漢語分詞方法及裝置;所述分詞方法包括以下步驟:S100:對傳統(tǒng)分詞詞表進行處理,形成適用于神經(jīng)網(wǎng)絡機器翻譯的新分詞詞表;S200:依照新分詞詞表,對句子進行分詞,采用前向最大匹配法和后向最大匹配法結(jié)合的方式,分別進行分詞;S300:將前向最大匹配法的分詞結(jié)果和后向最大匹配法的分詞結(jié)果進行比較,進行評價處理后擇一輸出,該方法降低了待譯文本的數(shù)據(jù)維度,提高了神經(jīng)網(wǎng)絡機器翻譯的效率和準確性。