一種文本相似度確定方法、裝置、設備及存儲介質

基本信息

申請?zhí)?/td> CN201810937072.7 申請日 -
公開(公告)號 CN109145299A 公開(公告)日 2019-01-04
申請公布號 CN109145299A 申請公布日 2019-01-04
分類號 G06F17/27;G06F16/35;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 史文麗;王晨光 申請(專利權)人 北京金山安全軟件有限公司
代理機構 北京柏杉松知識產權代理事務所(普通合伙) 代理人 北京金山安全軟件有限公司
地址 100123 北京市朝陽區(qū)姚家園南路1號惠通時代廣場8號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供了一種文本相似度確定方法、裝置、設備及存儲介質,其中,該方法包括;確定待分析文本;對待分析文本進行分句,得到待分析文本對應的多個句子;針對每個句子,將該句子輸入至預先訓練的神經網(wǎng)絡模型,得到該句子對應的語義特征向量,其中,神經網(wǎng)絡模型是根據(jù)多個第一訓練樣本以及多個第一訓練樣本分別對應的關聯(lián)句子訓練得到的;根據(jù)每個句子對應的語義特征向量,確定待分析文本對應的特定特征向量;計算待分析文本對應的特定特征向量之間的相似度,并將該相似度作為待分析文本之間的相似度。如此,能夠提高文本相似度確定的準確度。