一種漢語(yǔ)新動(dòng)詞識(shí)別方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201510846963.8 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN106815189B | 公開(kāi)(公告)日 | 2020-03-20 |
| 申請(qǐng)公布號(hào) | CN106815189B | 申請(qǐng)公布日 | 2020-03-20 |
| 分類號(hào) | G06F40/284;G06F40/242 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 王衛(wèi)明;符建輝 | 申請(qǐng)(專利權(quán))人 | 中科國(guó)力(鎮(zhèn)江)智能技術(shù)有限公司 |
| 代理機(jī)構(gòu) | 南京知識(shí)律師事務(wù)所 | 代理人 | 中科國(guó)力(鎮(zhèn)江)智能技術(shù)有限公司;鎮(zhèn)江諾尼基智能技術(shù)有限公司 |
| 地址 | 212009 江蘇省鎮(zhèn)江市高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)園區(qū)經(jīng)十二路668號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明一種漢語(yǔ)新動(dòng)詞識(shí)別方法,包括對(duì)原始訓(xùn)練語(yǔ)料庫(kù)CNCorpus進(jìn)行分詞,形成分詞語(yǔ)料庫(kù)TCNCorpus;識(shí)別分詞語(yǔ)料庫(kù)TCNCorpus中的可能的新動(dòng)詞,形成結(jié)果集合Tmp_Verb;驗(yàn)證集合Tmp_Verb中的新動(dòng)詞,形成結(jié)果集合VerbResult;輸出新動(dòng)詞集合VerbResult.本發(fā)明提出了一種利用漢語(yǔ)種子詞典中的詞語(yǔ)的信息,對(duì)從漢語(yǔ)語(yǔ)料中獲得新動(dòng)詞進(jìn)行識(shí)別。在經(jīng)過(guò)160GB的純文本語(yǔ)料的測(cè)試驗(yàn)證后,本發(fā)明的系統(tǒng)獲得了41012個(gè)新的漢語(yǔ)動(dòng)詞。經(jīng)過(guò)準(zhǔn)確性分析,結(jié)果顯示96.9%的新動(dòng)詞為正確的漢語(yǔ)動(dòng)詞。 |





