基于搜索的近義詞庫更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請?zhí)?/td> CN202111621342.1 申請日 -
公開(公告)號 CN114491215A 公開(公告)日 2022-05-13
申請公布號 CN114491215A 申請公布日 2022-05-13
分類號 G06F16/953(2019.01)I;G06F16/955(2019.01)I;G06F16/36(2019.01)I;G06F16/33(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 余文鋒 申請(專利權(quán))人 深圳市游迷天下科技有限公司
代理機(jī)構(gòu) 深圳市恒程創(chuàng)新知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 518000廣東省深圳市福田區(qū)沙頭街道福強(qiáng)路3030號福田體育公園文化體育產(chǎn)業(yè)總部大廈8樓C區(qū)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于搜索的近義詞庫更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),涉及自然語言處理領(lǐng)域,該方法包括:獲取待對比的第一目標(biāo)詞語和第二目標(biāo)詞語,生成包含第一目標(biāo)詞語的第一語句集合,以及包含第二目標(biāo)詞語的第二語句集合;基于第一語句集合和第二語句集合,計(jì)算第一目標(biāo)詞語和第二目標(biāo)詞語的特征相似度;若特征相似度大于目標(biāo)預(yù)設(shè)閾值,則獲取第一目標(biāo)詞語的第一網(wǎng)絡(luò)搜索結(jié)果,以及第二目標(biāo)詞語的第二網(wǎng)絡(luò)搜索結(jié)果,并根據(jù)第一網(wǎng)絡(luò)搜索結(jié)果和第二網(wǎng)絡(luò)搜索結(jié)果,判斷第一目標(biāo)詞語和第二目標(biāo)詞語是否為近義詞;若第一目標(biāo)詞語和第二目標(biāo)詞語是近義詞,則將第一目標(biāo)詞語和第二目標(biāo)詞語綁定至預(yù)設(shè)近義詞庫,本發(fā)明提高了近義詞挖掘的準(zhǔn)確度。