一種翻譯模型的訓練方法及裝置、翻譯方法及裝置

基本信息

申請?zhí)?/td> CN202010215046.0 申請日 -
公開(公告)號 CN113449529A 公開(公告)日 2021-09-28
申請公布號 CN113449529A 申請公布日 2021-09-28
分類號 G06F40/58(2020.01)I;G06F40/289(2020.01)I;G06F40/284(2020.01)I;G06F40/205(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李長亮;郭馨澤 申請(專利權)人 成都金山互動娛樂科技有限公司
代理機構 北京智信禾專利代理有限公司 代理人 王治東
地址 100085北京市海淀區(qū)小營西路33號金山軟件大廈2層西區(qū)
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N翻譯模型的訓練方法及裝置、翻譯方法及裝置,翻譯模型包括:編碼器和語言模型,語言模型采用目標語言的單語語料預訓練得到;訓練方法包括:將源語言樣本語句輸入至編碼器,得到與源語言樣本語句對應的第一編碼向量;將與源語言樣本語句對應的第一編碼向量和目標語言樣本語句輸入至語言模型,得到語言模型輸出的第一解碼向量以及第一解碼向量對應的誤差;基于第一解碼向量對應的誤差調(diào)整語言模型和編碼器的參數(shù),直至達到訓練停止條件,從而有效解決在雙語語料資源稀缺的情況下導致翻譯模型訓練不充分,進而獲得的翻譯結果質(zhì)量低下的問題,使翻譯模型在低資源翻譯任務下有更好的表現(xiàn),進一步的,提高了翻譯結果的質(zhì)量。