文本檢索方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010545374.7 申請(qǐng)日 -
公開(公告)號(hào) CN111444320B 公開(公告)日 2020-07-24
申請(qǐng)公布號(hào) CN111444320B 申請(qǐng)公布日 2020-07-24
分類號(hào) G06F16/33(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 時(shí)愛民;楊剛;葉俊鋒;仲如星 申請(qǐng)(專利權(quán))人 太平財(cái)產(chǎn)保險(xiǎn)有限公司
代理機(jī)構(gòu) 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 代理人 黃麗霞
地址 201201上海市浦東新區(qū)卡園三路58號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種文本檢索方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。所述方法通過響應(yīng)于文本檢索請(qǐng)求,將文本檢索請(qǐng)求中的檢索語句在待檢索文本集中通過TF?IDF算法進(jìn)行匹配,得到匹配的設(shè)定個(gè)數(shù)的候選文本,并通過語義表示學(xué)習(xí)模型獲取檢索語句的第一特征向量和每個(gè)候選文本中重要文本段的第二特征向量,并根據(jù)檢索語句的第一特征向量和每個(gè)候選文本中重要文本段的第二特征向量之間的相似度,獲取相似度較高的目標(biāo)個(gè)數(shù)的候選文本,進(jìn)而根據(jù)目標(biāo)個(gè)數(shù)的候選文本中每個(gè)候選文本相對(duì)于檢索語句的歷史關(guān)聯(lián)度的大小對(duì)目標(biāo)個(gè)數(shù)的候選文本進(jìn)行排序,其通過兩次篩選和排序從而實(shí)現(xiàn)基于語義理解的文本檢索,不僅提高了文本檢索的匹配度,且提高了檢索效率。??