基于非平行語料庫(kù)的熵模型英中作者實(shí)體自動(dòng)識(shí)別方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111444389.5 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN114218946A | 公開(公告)日 | 2022-03-22 |
| 申請(qǐng)公布號(hào) | CN114218946A | 申請(qǐng)公布日 | 2022-03-22 |
| 分類號(hào) | G06F40/295(2020.01)I;G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 高東平;張冉;魏曉瑤;秦奕;池慧 | 申請(qǐng)(專利權(quán))人 | 中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所 |
| 代理機(jī)構(gòu) | 北京正陽理工知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張利萍 |
| 地址 | 100020北京市朝陽區(qū)雅寶路3號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種基于非平行語料庫(kù)的熵模型英中作者實(shí)體自動(dòng)識(shí)別方法,屬于人工智能領(lǐng)域。首先本發(fā)明構(gòu)建中英文非平行語料庫(kù),基于構(gòu)建的醫(yī)學(xué)中英文文獻(xiàn)摘要非平行語料庫(kù)生成人名及機(jī)構(gòu)詞典;接著構(gòu)建英中文獻(xiàn)作者音譯特征函數(shù)、機(jī)構(gòu)特征函數(shù)、論文主題相似特征函數(shù);進(jìn)行最大熵模型訓(xùn)練,得到英文作者的中文名稱推薦結(jié)果。本發(fā)明較為方便的解決了英文作者的中文對(duì)應(yīng)問題,在自動(dòng)翻譯、學(xué)者畫像等方面具有廣泛應(yīng)用前景。 |





