一種基于知識(shí)庫(kù)應(yīng)用的語(yǔ)義搜索方法

基本信息

申請(qǐng)?zhí)?/td> CN202210207064.3 申請(qǐng)日 -
公開(公告)號(hào) CN114547253A 公開(公告)日 2022-05-27
申請(qǐng)公布號(hào) CN114547253A 申請(qǐng)公布日 2022-05-27
分類號(hào) G06F16/33(2019.01)I;G06F16/332(2019.01)I;G06F16/36(2019.01)I;G06F16/31(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姜曉丹;張晶;王雙;張成凱;傅天隆;呂子祺;韓興源 申請(qǐng)(專利權(quán))人 北京伽睿智能科技集團(tuán)有限公司
代理機(jī)構(gòu) 北京知呱呱知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 100192北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園北領(lǐng)地C-1樓1層106(東升地區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于知識(shí)庫(kù)應(yīng)用的語(yǔ)義搜索方法,所述方法為:S1、錄入文檔,通過(guò)分詞器將文檔拆分為詞語(yǔ),統(tǒng)計(jì)詞語(yǔ)出現(xiàn)的次數(shù),記錄詞語(yǔ)和文檔映射關(guān)系,將所有詞語(yǔ)和映射關(guān)系放入內(nèi)存當(dāng)做索引;S2、將索引分成多個(gè)分片,并對(duì)每個(gè)分片進(jìn)行備份,每個(gè)分片和備份分布在多臺(tái)服務(wù)器上,以分布式的方式提供查詢服務(wù);S3、輸入關(guān)鍵詞進(jìn)行智能搜索,基于關(guān)鍵詞進(jìn)行索引匹配和語(yǔ)義相似性擴(kuò)展搜索,基于關(guān)鍵詞圖譜的語(yǔ)義擴(kuò)展搜索具體實(shí)現(xiàn)邏輯;S4、根據(jù)確定的基于用戶行為的語(yǔ)義相似度及語(yǔ)義擴(kuò)展結(jié)果,預(yù)測(cè)用戶對(duì)知識(shí)庫(kù)資源的評(píng)分,將評(píng)分高資源信息作為推薦列表返回給用戶。本發(fā)明解決了現(xiàn)有資源搜索速度慢、準(zhǔn)確率低的問(wèn)題。