一種面向多語言混合文本的語義審核方法與系統(tǒng)

基本信息

申請?zhí)?/td> CN202110488706.7 申請日 -
公開(公告)號 CN113158695A 公開(公告)日 2021-07-23
申請公布號 CN113158695A 申請公布日 2021-07-23
分類號 G06F40/58;G06F40/30 分類 計算;推算;計數(shù);
發(fā)明人 王曉平 申請(專利權(quán))人 上海極鏈科技發(fā)展集團(tuán)有限公司
代理機(jī)構(gòu) 北京華沛德權(quán)律師事務(wù)所 代理人 房德權(quán)
地址 202150 上海市崇明區(qū)中興鎮(zhèn)汲浜公路39號21號樓1103室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計算機(jī)的技術(shù)領(lǐng)域,且公開了一種面向多語言混合文本的語義審核方法與系統(tǒng),包括以下步驟:S1、鑒別主輔語言,并提取翻譯輔語言;S2、MLM模型預(yù)測;S3、翻譯候選結(jié)果優(yōu)選替換;S4、主語言語義審核;通過設(shè)計MLM模型預(yù)測模塊和翻譯候選結(jié)果優(yōu)選模塊,使用詞性標(biāo)注篩選、詞向量相似度比較技術(shù),能夠準(zhǔn)確地從多義詞的多個翻譯結(jié)果中篩選出真正符合當(dāng)前上下文語境的結(jié)果,確保了翻譯結(jié)果對原本意思的正確表達(dá),從而為語義審核模型提供了可靠的輸入。