知識(shí)庫同名實(shí)例混淆檢測的方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201610974455.2 申請(qǐng)日 -
公開(公告)號(hào) CN108009184B 公開(公告)日 2021-08-27
申請(qǐng)公布號(hào) CN108009184B 申請(qǐng)公布日 2021-08-27
分類號(hào) G06F16/36(2019.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 謝海華;黃肖俊;呂肖慶;湯幟 申請(qǐng)(專利權(quán))人 北京方正阿帕比技術(shù)有限公司
代理機(jī)構(gòu) 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張蓮蓮;劉芳
地址 100871北京市海淀區(qū)成府路298號(hào)中關(guān)村方正大廈9層
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種知識(shí)庫同名實(shí)例混淆檢測的方法及裝置。該方法包括:獲取文本庫,文本庫內(nèi)容與知識(shí)庫的內(nèi)容相關(guān);獲取第一目標(biāo),根據(jù)第一目標(biāo)和文本庫,構(gòu)造第一目標(biāo)對(duì)應(yīng)的目標(biāo)向量的集合;其中,每個(gè)目標(biāo)向量的維數(shù)與文本庫中文本的個(gè)數(shù)相等,第一目標(biāo)為知識(shí)庫中的任意一個(gè)實(shí)例;對(duì)各目標(biāo)向量進(jìn)行聚類分析,根據(jù)聚類分析的結(jié)果確定知識(shí)庫是否發(fā)生同名實(shí)例混淆。本發(fā)明實(shí)施例通過對(duì)知識(shí)庫中的多個(gè)第一目標(biāo)進(jìn)行自動(dòng)檢測,來確定第一目標(biāo)中是否混雜有其他同名實(shí)例的有序集合,從而實(shí)現(xiàn)對(duì)知識(shí)庫同名實(shí)例混淆的自動(dòng)檢測,無需人工對(duì)每個(gè)第一目標(biāo)進(jìn)行核對(duì),節(jié)省了大量的人力,且大大提高了檢測效率。