利用知識(shí)圖譜計(jì)算文本和主體相關(guān)度的方法以及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810567101.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109033132B 公開(kāi)(公告)日 2018-12-18
申請(qǐng)公布號(hào) CN109033132B 申請(qǐng)公布日 2018-12-18
分類號(hào) G06F16/36(2019.01)I;G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫雨軒;吳成龍;周劼人 申請(qǐng)(專利權(quán))人 中證數(shù)智科技(深圳)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 518000廣東省深圳市福田區(qū)深南大道2012號(hào)深圳證券交易所廣場(chǎng)44樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種利用知識(shí)圖譜計(jì)算文本和主體相關(guān)度的方法以及裝置,所述方法包括:獲取文本;對(duì)文本進(jìn)行分詞處理,提取文本中出現(xiàn)的關(guān)鍵詞集合,通過(guò)預(yù)先建立的知識(shí)圖譜,檢索與關(guān)鍵詞相關(guān)聯(lián)的企業(yè)主體,以將所述與關(guān)鍵詞相關(guān)聯(lián)的企業(yè)主體作為候選的企業(yè)集合,其中,所述知識(shí)圖譜包括目標(biāo)節(jié)點(diǎn)信息、相關(guān)聯(lián)的節(jié)點(diǎn)信息、所述目標(biāo)節(jié)點(diǎn)信息與所述相關(guān)聯(lián)的節(jié)點(diǎn)信息之間的關(guān)系及關(guān)聯(lián)性權(quán)重,所述目標(biāo)節(jié)點(diǎn)信息包括第一企業(yè)主體信息,所述相關(guān)聯(lián)的節(jié)點(diǎn)信息包括與所述第一主體企業(yè)主體信息相關(guān)聯(lián)的第二主體信息、產(chǎn)品或自然人信息;根據(jù)所述候選的企業(yè)集合中的候選的企業(yè)主體關(guān)聯(lián)的關(guān)鍵詞出現(xiàn)的詞頻計(jì)算文本與所述候選的企業(yè)主體的關(guān)聯(lián)度。??