語言處理方法及裝置、語言處理系統(tǒng)的訓(xùn)練方法及裝置

基本信息

申請?zhí)?/td> CN201910867015.0 申請日 -
公開(公告)號 CN110598222A 公開(公告)日 2019-12-20
申請公布號 CN110598222A 申請公布日 2019-12-20
分類號 G06F17/28(2006.01); G06N3/08(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 徐智濤; 唐劍波; 李長亮; 郭馨澤 申請(專利權(quán))人 成都金山數(shù)字娛樂科技有限公司
代理機(jī)構(gòu) 北京智信禾專利代理有限公司 代理人 北京金山數(shù)字娛樂科技有限公司; 成都金山數(shù)字娛樂科技有限公司
地址 100085 北京市海淀區(qū)小營西路33號金山軟件大廈2層西區(qū)
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝苏Z言處理方法及裝置、語言處理系統(tǒng)的訓(xùn)練方法及裝置,其中,所述語言處理方法包括:將包括多個待翻譯語句的目標(biāo)段落輸入翻譯模型,得到每個待翻譯語句對應(yīng)的翻譯語句;將包含連接詞的翻譯語句中的連接詞替換為連接標(biāo)記,將不包含連接詞的翻譯語句中插入連接標(biāo)記,生成每個翻譯語句對應(yīng)的標(biāo)記翻譯語句;將多個標(biāo)記翻譯語句輸入已訓(xùn)練好的語言模型,語言模型將連接標(biāo)記刪除或替換為對應(yīng)的最終連接詞,得到每個標(biāo)記翻譯語句對應(yīng)的最終翻譯語句,根據(jù)每個標(biāo)記翻譯語句對應(yīng)的最終翻譯語句拼接得到翻譯段落,從而使段落的翻譯結(jié)果的語義表達(dá)更加流暢,實現(xiàn)了目標(biāo)任務(wù)語言處理的有效提升。