一種文本相似度匹配及計算方法、系統(tǒng)和裝置
基本信息

| 申請?zhí)?/td> | CN202011301241.1 | 申請日 | - |
| 公開(公告)號 | CN112364124A | 公開(公告)日 | 2021-02-12 |
| 申請公布號 | CN112364124A | 申請公布日 | 2021-02-12 |
| 分類號 | G06F16/31(2019.01)I; | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 康維;孔澤平;周珞;陳光林;胡梓欽 | 申請(專利權(quán))人 | 湖南紅網(wǎng)新媒體集團有限公司 |
| 代理機構(gòu) | - | 代理人 | - |
| 地址 | 410004湖南省長沙市天心區(qū)韶山南路258號紅網(wǎng)大樓 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請涉及一種文本相似度匹配及計算方法、系統(tǒng)和裝置。本申請包括采集待處理文本數(shù)據(jù)T和待處理文本數(shù)據(jù)T1,對文本數(shù)據(jù)T1進行分詞,獲取文本數(shù)據(jù)T1的特征詞及權(quán)重數(shù)據(jù);獲取文本數(shù)據(jù)T1對應(yīng)的n位特征值S;將特征值S均分為k等分,得到數(shù)組P1,并將特征向量數(shù)組P1逐一與特征向量數(shù)組P對比,根據(jù)匹配命中的特征值召回原文本內(nèi)容T2;獲取文本數(shù)據(jù)T1和文本數(shù)據(jù)T2的分詞和權(quán)重結(jié)果;對分詞結(jié)果進行向量化處理,分別獲取本文數(shù)據(jù)T1的特征向量V1和本文數(shù)據(jù)T2的特征向量V2;計算特征向量V1和特征向量V2的余弦值,根據(jù)余弦值得到本文數(shù)據(jù)T1與被匹配文本數(shù)據(jù)T2的相似度值,具有的適應(yīng)不同的數(shù)據(jù)量和提高計算速度效果。?? |





