一種文本相似度計(jì)算方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111129085.X | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113987115A | 公開(kāi)(公告)日 | 2022-01-28 |
| 申請(qǐng)公布號(hào) | CN113987115A | 申請(qǐng)公布日 | 2022-01-28 |
| 分類號(hào) | G06F16/33(2019.01)I;G06F40/194(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 王偉;黃勇其;于翠翠;張黔 | 申請(qǐng)(專利權(quán))人 | 華潤(rùn)數(shù)字科技(西安)有限公司 |
| 代理機(jī)構(gòu) | 深圳市世聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 姜妍 |
| 地址 | 710000陜西省西安市高新區(qū)天谷八路211號(hào)環(huán)普科技產(chǎn)業(yè)園C座303、304室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實(shí)施例屬于人工智能領(lǐng)域,尤其涉及一種文本相似度計(jì)算方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),所述方法包括:識(shí)別待比對(duì)文本中的數(shù)學(xué)符號(hào),根據(jù)預(yù)設(shè)的符號(hào)?文字字典查找數(shù)學(xué)符號(hào)對(duì)應(yīng)的文字描述,并將待比對(duì)文本中的數(shù)學(xué)符號(hào)替換成查找到的文字描述;對(duì)待比對(duì)文本進(jìn)行分詞,基于分詞計(jì)算待比對(duì)文本中每個(gè)句子的初級(jí)表征向量,其中待比對(duì)文本至少為兩個(gè);將不同的待比對(duì)文本中每個(gè)句子的初級(jí)表征向量輸入到語(yǔ)義編碼器,通過(guò)語(yǔ)義編碼器計(jì)算得到待比對(duì)文本的最終表征向量,語(yǔ)義編碼器至少為兩個(gè);及語(yǔ)義編碼器將待比對(duì)文本的最終表征向量輸入到相似度計(jì)算器,獲取不同兩個(gè)待比對(duì)文本的相似度。本發(fā)明提高了相似性度計(jì)算的穩(wěn)定性和準(zhǔn)確性。 |





