文本相似度計(jì)算方法、裝置及計(jì)算機(jī)設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202111145040.1 申請(qǐng)日 -
公開(公告)號(hào) CN113987117A 公開(公告)日 2022-01-28
申請(qǐng)公布號(hào) CN113987117A 申請(qǐng)公布日 2022-01-28
分類號(hào) G06F16/33(2019.01)I;G06F40/194(2020.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N20/20(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王偉;黃勇其;于翠翠;張黔 申請(qǐng)(專利權(quán))人 華潤(rùn)數(shù)字科技(西安)有限公司
代理機(jī)構(gòu) 深圳市世聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 楊暉瓊
地址 710000陜西省西安市高新區(qū)天谷八路211號(hào)環(huán)普科技產(chǎn)業(yè)園C座303、304室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例屬于人工智能和自然語言處理領(lǐng)域,應(yīng)用于文本處理領(lǐng)域中,涉及一種文本相似度計(jì)算方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),方法包括獲取基于神經(jīng)網(wǎng)絡(luò)的M個(gè)文本相似度算法模型;提取每個(gè)文本相似度算法模型的模型特征;根據(jù)所述模型特征,將所述M個(gè)文本相似度算法模型進(jìn)行聚類,得到K個(gè)模型簇,其中,K小于或等于M;通過強(qiáng)化學(xué)習(xí)對(duì)每個(gè)模型簇進(jìn)行訓(xùn)練,并利用集成學(xué)習(xí)對(duì)每個(gè)文本相似度算法模型進(jìn)行權(quán)重分配,得到綜合文本相似度算法模型;通過所述綜合文本相似度算法模型對(duì)目標(biāo)文本進(jìn)行相似度計(jì)算。此外,本申請(qǐng)還涉及區(qū)塊鏈技術(shù),文本相似度算法模型可存儲(chǔ)于區(qū)塊鏈中。本申請(qǐng)解決了文本相似度的計(jì)算準(zhǔn)確率不穩(wěn)定的問題。