文本相似度計算方法及裝置

基本信息

申請?zhí)?/td> CN201811497301.4 申請日 -
公開(公告)號 CN109344245B 公開(公告)日 2019-07-23
申請公布號 CN109344245B 申請公布日 2019-07-23
分類號 G06F16/332;G06F17/27;G06F17/22 分類 計算;推算;計數(shù);
發(fā)明人 楊凱程;李健銓;蔣宏飛 申請(專利權(quán))人 安徽省泰岳祥升軟件有限公司
代理機構(gòu) 北京弘權(quán)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 逯長明;許偉群
地址 230088 安徽省合肥市高新區(qū)習(xí)友路3333號中國(合肥)國際智能語音產(chǎn)業(yè)園研發(fā)中心樓405-5室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供了一種文本相似度計算方法及裝置,本發(fā)明實施例首先獲取兩個文本的最長公共子序列,之后對兩個文本對應(yīng)的詞匯集合計算交集和并集,之后根據(jù)得到的交集和并集計算得到第一相似度,利用上述最長公共子序列對應(yīng)的詞匯集合以及之前得到的并集計算第二相似度,最后根據(jù)第一相似度和第二相似度計算得到兩個文本的目標相似度。上述技術(shù)方案結(jié)合最長公共子序列以及文本中各個詞匯,計算兩個文本的相似度,有效提高了文本相似度的計算精度。進一步地,利用準確的文本相似度,能夠為用戶提供更加準確的答復(fù),提高了智能交互的服務(wù)質(zhì)量和用戶的體驗度。