文本相似度計(jì)算方法、裝置及計(jì)算機(jī)設(shè)備
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111145040.1 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN113987117A | 公開(公告)日 | 2022-01-28 |
| 申請(qǐng)公布號(hào) | CN113987117A | 申請(qǐng)公布日 | 2022-01-28 |
| 分類號(hào) | G06F16/33(2019.01)I;G06F40/194(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N20/20(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 王偉;黃勇其;于翠翠;張黔 | 申請(qǐng)(專利權(quán))人 | 華潤(rùn)數(shù)字科技(西安)有限公司 |
| 代理機(jī)構(gòu) | 深圳市世聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 楊暉瓊 |
| 地址 | 710000陜西省西安市高新區(qū)天谷八路211號(hào)環(huán)普科技產(chǎn)業(yè)園C座303、304室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請(qǐng)實(shí)施例屬于人工智能和自然語言處理領(lǐng)域,應(yīng)用于文本處理領(lǐng)域中,涉及一種文本相似度計(jì)算方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),方法包括獲取基于神經(jīng)網(wǎng)絡(luò)的M個(gè)文本相似度算法模型;提取每個(gè)文本相似度算法模型的模型特征;根據(jù)所述模型特征,將所述M個(gè)文本相似度算法模型進(jìn)行聚類,得到K個(gè)模型簇,其中,K小于或等于M;通過強(qiáng)化學(xué)習(xí)對(duì)每個(gè)模型簇進(jìn)行訓(xùn)練,并利用集成學(xué)習(xí)對(duì)每個(gè)文本相似度算法模型進(jìn)行權(quán)重分配,得到綜合文本相似度算法模型;通過所述綜合文本相似度算法模型對(duì)目標(biāo)文本進(jìn)行相似度計(jì)算。此外,本申請(qǐng)還涉及區(qū)塊鏈技術(shù),文本相似度算法模型可存儲(chǔ)于區(qū)塊鏈中。本申請(qǐng)解決了文本相似度的計(jì)算準(zhǔn)確率不穩(wěn)定的問題。 |





