專(zhuān)利雙語(yǔ)句對(duì)加工方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201911064809.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110807337B 公開(kāi)(公告)日 2021-11-12
申請(qǐng)公布號(hào) CN110807337B 申請(qǐng)公布日 2021-11-12
分類(lèi)號(hào) G06F40/58(2020.01)I;G06F40/242(2020.01)I;G06F40/166(2020.01)I;G06F40/137(2020.01)I;G06F40/131(2020.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張孝飛;張遷;馬偉;李帥;馬毓昭 申請(qǐng)(專(zhuān)利權(quán))人 北京中獻(xiàn)電子技術(shù)開(kāi)發(fā)有限公司
代理機(jī)構(gòu) 中科專(zhuān)利商標(biāo)代理有限責(zé)任公司 代理人 鄢功軍
地址 100081北京市海淀區(qū)氣象路50號(hào)中知大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及機(jī)器翻譯技術(shù)領(lǐng)域,尤其涉及一種專(zhuān)利雙語(yǔ)句對(duì)加工方法及系統(tǒng);所述方法包括以下步驟:獲取專(zhuān)利篇章級(jí)雙語(yǔ)對(duì)齊語(yǔ)料;提取專(zhuān)利雙語(yǔ)篇章級(jí)文章的內(nèi)容特征;根據(jù)內(nèi)容特征,對(duì)雙語(yǔ)對(duì)齊篇章級(jí)語(yǔ)料進(jìn)行內(nèi)容模塊的切分并分級(jí)處理;根據(jù)內(nèi)容分級(jí)模塊結(jié)果進(jìn)行段落模塊切分;對(duì)不同段落模塊進(jìn)行分類(lèi)整理;根據(jù)段落模塊的分類(lèi)整理結(jié)果,進(jìn)行句子級(jí)對(duì)齊的分類(lèi)整理。本發(fā)明所公開(kāi)的專(zhuān)利雙語(yǔ)句對(duì)加工方法及系統(tǒng),在統(tǒng)計(jì)翻譯的基礎(chǔ)上,從專(zhuān)利領(lǐng)域出發(fā),在對(duì)專(zhuān)利文獻(xiàn)分析的基礎(chǔ)上,形成專(zhuān)利知識(shí)庫(kù),再結(jié)合神經(jīng)網(wǎng)絡(luò)翻譯,實(shí)現(xiàn)了專(zhuān)利雙語(yǔ)句對(duì)庫(kù)的自動(dòng)抽取和生成,極大的提高了效率和準(zhǔn)確率,有利于快速建立專(zhuān)利領(lǐng)域雙語(yǔ)句對(duì)語(yǔ)料庫(kù)。