基于詞向量的高效率語(yǔ)義拓展檢索方法、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111346635.3 申請(qǐng)日 -
公開(公告)號(hào) CN114116953A 公開(公告)日 2022-03-01
申請(qǐng)公布號(hào) CN114116953A 申請(qǐng)公布日 2022-03-01
分類號(hào) G06F16/31(2019.01)I;G06F16/33(2019.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 何夏輝;俞書浩;王凱麗;曹心怡;陳昱瑩 申請(qǐng)(專利權(quán))人 交通銀行股份有限公司
代理機(jī)構(gòu) 上??剖⒅R(shí)產(chǎn)權(quán)代理有限公司 代理人 蔡彭君
地址 200120上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)銀城中路188號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于詞向量的高效率語(yǔ)義拓展檢索方法、裝置及存儲(chǔ)介質(zhì),其中方法包括:步驟S1:進(jìn)行語(yǔ)料清洗得到統(tǒng)一格式的語(yǔ)料;步驟S2:對(duì)語(yǔ)料進(jìn)行分詞,得到詞匯;步驟S3:將所有詞匯利用訓(xùn)練好的詞向量模型轉(zhuǎn)換為詞向量;步驟S4:基于余弦距離采用二叉樹法對(duì)詞向量建立索引;步驟S5:接收檢索關(guān)鍵詞,并轉(zhuǎn)換為詞向量,利用建立好的索引得到近義詞;步驟S6:將關(guān)鍵詞進(jìn)行分詞;步驟S7:分別以原詞、近義詞,以及分詞進(jìn)行研報(bào)檢索,得到原詞檢索結(jié)果、近義詞檢索結(jié)果和分詞檢索結(jié)果;步驟S8:將同時(shí)出現(xiàn)在原詞檢索結(jié)果、近義詞檢索結(jié)果和分詞檢索結(jié)果中的研報(bào)作為最優(yōu)先級(jí)結(jié)果進(jìn)行呈現(xiàn)。與現(xiàn)有技術(shù)相比,本發(fā)明具有提高響應(yīng)速度和準(zhǔn)確性等優(yōu)點(diǎn)。