一種漢語兼語結(jié)構(gòu)獲取方法

基本信息

申請(qǐng)?zhí)?/td> CN201510846489.9 申請(qǐng)日 -
公開(公告)號(hào) CN106815188B 公開(公告)日 2020-02-18
申請(qǐng)公布號(hào) CN106815188B 申請(qǐng)公布日 2020-02-18
分類號(hào) G06F40/284 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 符建輝;王衛(wèi)明;曹陽 申請(qǐng)(專利權(quán))人 中科國(guó)力(鎮(zhèn)江)智能技術(shù)有限公司
代理機(jī)構(gòu) 南京知識(shí)律師事務(wù)所 代理人 中科國(guó)力(鎮(zhèn)江)智能技術(shù)有限公司;鎮(zhèn)江諾尼基智能技術(shù)有限公司
地址 212009 江蘇省鎮(zhèn)江市高新技術(shù)產(chǎn)業(yè)開發(fā)園區(qū)經(jīng)十二路668號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種漢語兼語結(jié)構(gòu)獲取方法,包括對(duì)原始訓(xùn)練語料庫Corpus進(jìn)行分詞,形成分詞語料庫TCorpus;識(shí)別分詞語料庫TCorpus中的每條語句Si中動(dòng)詞;應(yīng)用兼語模式對(duì)TCorpus中的語句進(jìn)行分析,對(duì)滿足兼語模式的語句形成候選兼語結(jié)構(gòu),并且置入待驗(yàn)證的兼語結(jié)構(gòu)庫SOBase中;驗(yàn)證候選兼語結(jié)構(gòu)庫SOBase,并輸出最終結(jié)果SOBaseResult;本發(fā)明引入了兼語模式,可在不降低獲取效果的前提下極大地控制兼語形式的復(fù)雜性。針對(duì)漢語構(gòu)詞和語句的復(fù)雜性,為確保兼語結(jié)構(gòu)的準(zhǔn)確性,本發(fā)明從“兼語結(jié)構(gòu)搭配多樣性”、“兼語結(jié)構(gòu)搭配常見性”雙重角度,對(duì)獲得的兼語結(jié)構(gòu)進(jìn)行嚴(yán)格的驗(yàn)證。