一種適用于神經(jīng)網(wǎng)絡機器翻譯的漢語分詞方法及裝置
基本信息

| 申請?zhí)?/td> | CN201911028104.2 | 申請日 | - |
| 公開(公告)號 | CN110852099A | 公開(公告)日 | 2020-02-28 |
| 申請公布號 | CN110852099A | 申請公布日 | 2020-02-28 |
| 分類號 | G06F40/289;G06F40/216;G06F40/58 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 張孝飛;葛昱暉;陳莉莉;李帥;呂榮波 | 申請(專利權)人 | 北京中獻電子技術開發(fā)有限公司 |
| 代理機構 | 中科專利商標代理有限責任公司 | 代理人 | 鄢功軍 |
| 地址 | 100081 北京市海淀區(qū)氣象路50號中知大廈 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及機器翻譯技術領域,尤其涉及一種適用于神經(jīng)網(wǎng)絡機器翻譯的漢語分詞方法及裝置;所述分詞方法包括以下步驟:S100:對傳統(tǒng)分詞詞表進行處理,形成適用于神經(jīng)網(wǎng)絡機器翻譯的新分詞詞表;S200:依照新分詞詞表,對句子進行分詞,采用前向最大匹配法和后向最大匹配法結(jié)合的方式,分別進行分詞;S300:將前向最大匹配法的分詞結(jié)果和后向最大匹配法的分詞結(jié)果進行比較,進行評價處理后擇一輸出,該方法降低了待譯文本的數(shù)據(jù)維度,提高了神經(jīng)網(wǎng)絡機器翻譯的效率和準確性。 |





