消除新聞中行業(yè)詞歧義的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110590171.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113407717A 公開(kāi)(公告)日 2021-09-17
申請(qǐng)公布號(hào) CN113407717A 申請(qǐng)公布日 2021-09-17
分類(lèi)號(hào) G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/216(2020.01)I;G06F40/247(2020.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 賈寧 申請(qǐng)(專(zhuān)利權(quán))人 數(shù)庫(kù)(上海)科技有限公司
代理機(jī)構(gòu) 上海十蕙一蘭知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉秋蘭
地址 201112上海市閔行區(qū)陳行路2388號(hào)9號(hào)樓8層801室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種消除新聞中行業(yè)詞歧義的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)。其中方法包括:獲取新聞,對(duì)新聞進(jìn)行行業(yè)分類(lèi),得到行業(yè)標(biāo)簽分類(lèi)結(jié)果;對(duì)行業(yè)標(biāo)簽分類(lèi)結(jié)果進(jìn)行標(biāo)簽共現(xiàn)檢驗(yàn),若檢驗(yàn)未通過(guò),則將全部的行業(yè)標(biāo)簽加入歧義判別列表中,若檢驗(yàn)通過(guò),則將存在歧義詞集合中的特征詞對(duì)應(yīng)的行業(yè)標(biāo)簽加入歧義判別列表中,若不存在,則直接輸出結(jié)果;通過(guò)預(yù)設(shè)的歧義判別模型對(duì)歧義判別列表中的行業(yè)標(biāo)簽進(jìn)行判別,得到歧義判別結(jié)果,根據(jù)歧義判別結(jié)果進(jìn)行輸出。本發(fā)明擺脫了對(duì)歧義詞表或知識(shí)圖譜的重度依賴(lài),可以自動(dòng)發(fā)現(xiàn)歧義詞表之外的歧義詞帶來(lái)的錯(cuò)誤,大大減少了開(kāi)發(fā)成本。