一種基于圖知識(shí)庫(kù)的分布式信息檢索集合選擇方法

基本信息

申請(qǐng)?zhí)?/td> CN201710228718.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107133274B 公開(kāi)(公告)日 2020-12-15
申請(qǐng)公布號(hào) CN107133274B 申請(qǐng)公布日 2020-12-15
分類(lèi)號(hào) G06F16/33;G06F16/36;G06F40/295;G06F40/30 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳勇;陳嶺;韓保禮;季海琦;鄭羽 申請(qǐng)(專(zhuān)利權(quán))人 浙江鴻程計(jì)算機(jī)系統(tǒng)有限公司
代理機(jī)構(gòu) 杭州之江專(zhuān)利事務(wù)所(普通合伙) 代理人 張慧英
地址 310053 浙江省杭州市濱江區(qū)浦沿街道偉業(yè)路1號(hào)2幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于圖知識(shí)庫(kù)的分布式信息檢索集合選擇方法,主要包括如下步驟:1)采用實(shí)體鏈接方法,從各個(gè)集合的樣本文檔中獲取集合的實(shí)體詞集;2)基于上下文相關(guān)度和結(jié)構(gòu)相關(guān)度,計(jì)算實(shí)體詞的權(quán)重,使用加權(quán)的實(shí)體詞集表示集合的語(yǔ)義信息;3)采用查詢(xún)擴(kuò)展方法擴(kuò)展查詢(xún)中包含的實(shí)體詞,并為查詢(xún)實(shí)體詞賦予不同的權(quán)重;4)采用查詢(xún)與集合相關(guān)度度量方法計(jì)算集合評(píng)分,選擇評(píng)分較高的前若干個(gè)集合。本發(fā)明利用圖知識(shí)庫(kù)中蘊(yùn)含的實(shí)體關(guān)系和網(wǎng)絡(luò)結(jié)構(gòu),使用基于圖知識(shí)庫(kù)的集合語(yǔ)義建模方法、查詢(xún)擴(kuò)展方法和查詢(xún)與集合相關(guān)度度量方法,提高了集合選擇方法的準(zhǔn)確度。