基于領(lǐng)域本體結(jié)合機(jī)器學(xué)習(xí)模型的漢語(yǔ)文本共指消解方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN200810246639.2 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN101770453A | 公開(kāi)(公告)日 | 2010-07-07 |
| 申請(qǐng)公布號(hào) | CN101770453A | 申請(qǐng)公布日 | 2010-07-07 |
| 分類(lèi)號(hào) | G06F17/27(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 黃河燕 | 申請(qǐng)(專(zhuān)利權(quán))人 | 華建機(jī)器翻譯有限公司 |
| 代理機(jī)構(gòu) | 北京北新智誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 華建機(jī)器翻譯有限公司 |
| 地址 | 100083 北京市海淀區(qū)北四環(huán)中路257號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種基于領(lǐng)域本體結(jié)合機(jī)器學(xué)習(xí)模型的漢語(yǔ)文本共指消解方法,包括如下步驟:(1)構(gòu)建完成領(lǐng)域本體;(2)輸入待處理的漢語(yǔ)文本;(3)對(duì)步驟(2)中的漢語(yǔ)文本進(jìn)行分詞與詞性標(biāo)注處理;(4)將漢語(yǔ)文本中的命名實(shí)體分為常規(guī)命名實(shí)體和領(lǐng)域命名實(shí)體兩類(lèi),利用步驟(1)中構(gòu)建的領(lǐng)域本體通過(guò)形式化實(shí)例獲取詞性規(guī)則模板,結(jié)合CRF模型,針對(duì)領(lǐng)域命名實(shí)體進(jìn)行識(shí)別處理;(5)針對(duì)領(lǐng)域命名實(shí)體之外的普通名詞短語(yǔ)進(jìn)行歸并處理;(6)利用步驟(1)中構(gòu)建的領(lǐng)域本體,獲取語(yǔ)義類(lèi)特征,結(jié)合機(jī)器學(xué)習(xí)模型,針對(duì)領(lǐng)域命名實(shí)體及普通名詞短語(yǔ)進(jìn)行共指消解處理。本漢語(yǔ)文本共指消解方法對(duì)人工成本要求較低,能夠在短時(shí)間內(nèi)獲取高準(zhǔn)確率的共指消解處理結(jié)果。 |





