基于詞向量的高效率語(yǔ)義拓展檢索方法、裝置及存儲(chǔ)介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111346635.3 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN114116953A | 公開(公告)日 | 2022-03-01 |
| 申請(qǐng)公布號(hào) | CN114116953A | 申請(qǐng)公布日 | 2022-03-01 |
| 分類號(hào) | G06F16/31(2019.01)I;G06F16/33(2019.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 何夏輝;俞書浩;王凱麗;曹心怡;陳昱瑩 | 申請(qǐng)(專利權(quán))人 | 交通銀行股份有限公司 |
| 代理機(jī)構(gòu) | 上??剖⒅R(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 蔡彭君 |
| 地址 | 200120上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)銀城中路188號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種基于詞向量的高效率語(yǔ)義拓展檢索方法、裝置及存儲(chǔ)介質(zhì),其中方法包括:步驟S1:進(jìn)行語(yǔ)料清洗得到統(tǒng)一格式的語(yǔ)料;步驟S2:對(duì)語(yǔ)料進(jìn)行分詞,得到詞匯;步驟S3:將所有詞匯利用訓(xùn)練好的詞向量模型轉(zhuǎn)換為詞向量;步驟S4:基于余弦距離采用二叉樹法對(duì)詞向量建立索引;步驟S5:接收檢索關(guān)鍵詞,并轉(zhuǎn)換為詞向量,利用建立好的索引得到近義詞;步驟S6:將關(guān)鍵詞進(jìn)行分詞;步驟S7:分別以原詞、近義詞,以及分詞進(jìn)行研報(bào)檢索,得到原詞檢索結(jié)果、近義詞檢索結(jié)果和分詞檢索結(jié)果;步驟S8:將同時(shí)出現(xiàn)在原詞檢索結(jié)果、近義詞檢索結(jié)果和分詞檢索結(jié)果中的研報(bào)作為最優(yōu)先級(jí)結(jié)果進(jìn)行呈現(xiàn)。與現(xiàn)有技術(shù)相比,本發(fā)明具有提高響應(yīng)速度和準(zhǔn)確性等優(yōu)點(diǎn)。 |





