一種基于知識(shí)庫(kù)應(yīng)用的語(yǔ)義搜索方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202210207064.3 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN114547253A | 公開(公告)日 | 2022-05-27 |
| 申請(qǐng)公布號(hào) | CN114547253A | 申請(qǐng)公布日 | 2022-05-27 |
| 分類號(hào) | G06F16/33(2019.01)I;G06F16/332(2019.01)I;G06F16/36(2019.01)I;G06F16/31(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 姜曉丹;張晶;王雙;張成凱;傅天隆;呂子祺;韓興源 | 申請(qǐng)(專利權(quán))人 | 北京伽睿智能科技集團(tuán)有限公司 |
| 代理機(jī)構(gòu) | 北京知呱呱知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | - |
| 地址 | 100192北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園北領(lǐng)地C-1樓1層106(東升地區(qū)) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于知識(shí)庫(kù)應(yīng)用的語(yǔ)義搜索方法,所述方法為:S1、錄入文檔,通過(guò)分詞器將文檔拆分為詞語(yǔ),統(tǒng)計(jì)詞語(yǔ)出現(xiàn)的次數(shù),記錄詞語(yǔ)和文檔映射關(guān)系,將所有詞語(yǔ)和映射關(guān)系放入內(nèi)存當(dāng)做索引;S2、將索引分成多個(gè)分片,并對(duì)每個(gè)分片進(jìn)行備份,每個(gè)分片和備份分布在多臺(tái)服務(wù)器上,以分布式的方式提供查詢服務(wù);S3、輸入關(guān)鍵詞進(jìn)行智能搜索,基于關(guān)鍵詞進(jìn)行索引匹配和語(yǔ)義相似性擴(kuò)展搜索,基于關(guān)鍵詞圖譜的語(yǔ)義擴(kuò)展搜索具體實(shí)現(xiàn)邏輯;S4、根據(jù)確定的基于用戶行為的語(yǔ)義相似度及語(yǔ)義擴(kuò)展結(jié)果,預(yù)測(cè)用戶對(duì)知識(shí)庫(kù)資源的評(píng)分,將評(píng)分高資源信息作為推薦列表返回給用戶。本發(fā)明解決了現(xiàn)有資源搜索速度慢、準(zhǔn)確率低的問(wèn)題。 |





