多音字處理方法及裝置
基本信息

| 申請?zhí)?/td> | CN202110528205.7 | 申請日 | - |
| 公開(公告)號 | CN113268989A | 公開(公告)日 | 2021-08-17 |
| 申請公布號 | CN113268989A | 申請公布日 | 2021-08-17 |
| 分類號 | G06F40/30(2020.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N5/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 張文博;李長亮;郭馨澤 | 申請(專利權(quán))人 | 北京金山數(shù)字娛樂科技有限公司 |
| 代理機構(gòu) | 北京智信禾專利代理有限公司 | 代理人 | 李曉慶 |
| 地址 | 100085北京市海淀區(qū)西二旗中路33號院5號樓11層002號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請?zhí)峁┑乃龆嘁糇痔幚矸椒把b置,其中,所述方法包括基于語言模型以及多音字消歧模型的雙向長短期記憶網(wǎng)絡(luò),獲得包含多音字的中文語句的語義上下文向量;對所述中文語句進行分詞,并基于分詞獲得的詞語以及所述詞語的詞性確定所述中文語句中多音字的詞性向量;基于所述中文語句中的多音字以及所述詞性向量,確定所述中文語句的編碼向量;將所述語義上下文向量以及所述編碼向量輸入所述多音字消歧模型,獲取所述多音字對應(yīng)的讀音。具體的,所述多音字處理方法在包含多音字的中文語句的信息編碼階段引入語言模型,并引入中文語句中的多音字前后詞的詞性信息,以提高多音字消除歧義任務(wù)中多音字消歧模型對該中文語句中多音字的讀音的預(yù)測準(zhǔn)確性。 |





