文本檢索方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202010545374.7 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN111444320B | 公開(公告)日 | 2020-07-24 |
| 申請(qǐng)公布號(hào) | CN111444320B | 申請(qǐng)公布日 | 2020-07-24 |
| 分類號(hào) | G06F16/33(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 時(shí)愛民;楊剛;葉俊鋒;仲如星 | 申請(qǐng)(專利權(quán))人 | 太平財(cái)產(chǎn)保險(xiǎn)有限公司 |
| 代理機(jī)構(gòu) | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 | 代理人 | 黃麗霞 |
| 地址 | 201201上海市浦東新區(qū)卡園三路58號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請(qǐng)涉及一種文本檢索方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。所述方法通過響應(yīng)于文本檢索請(qǐng)求,將文本檢索請(qǐng)求中的檢索語句在待檢索文本集中通過TF?IDF算法進(jìn)行匹配,得到匹配的設(shè)定個(gè)數(shù)的候選文本,并通過語義表示學(xué)習(xí)模型獲取檢索語句的第一特征向量和每個(gè)候選文本中重要文本段的第二特征向量,并根據(jù)檢索語句的第一特征向量和每個(gè)候選文本中重要文本段的第二特征向量之間的相似度,獲取相似度較高的目標(biāo)個(gè)數(shù)的候選文本,進(jìn)而根據(jù)目標(biāo)個(gè)數(shù)的候選文本中每個(gè)候選文本相對(duì)于檢索語句的歷史關(guān)聯(lián)度的大小對(duì)目標(biāo)個(gè)數(shù)的候選文本進(jìn)行排序,其通過兩次篩選和排序從而實(shí)現(xiàn)基于語義理解的文本檢索,不僅提高了文本檢索的匹配度,且提高了檢索效率。?? |





