一種自適應(yīng)文本檢索方法
基本信息

| 申請?zhí)?/td> | CN201810657307.7 | 申請日 | - |
| 公開(公告)號 | CN108920576A | 公開(公告)日 | 2018-11-30 |
| 申請公布號 | CN108920576A | 申請公布日 | 2018-11-30 |
| 分類號 | G06F17/30;G06F17/27 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 么永輝 | 申請(專利權(quán))人 | 中科點(diǎn)擊(北京)科技有限公司 |
| 代理機(jī)構(gòu) | 北京兆君聯(lián)合知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 中科點(diǎn)擊(北京)科技有限公司 |
| 地址 | 100193 北京市海淀區(qū)東北旺西路中關(guān)村軟件園2期華勝天成大廈2層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了一種自適應(yīng)文本檢索方法,包括:將訓(xùn)練語料庫生成詞庫;利用所述生成的詞庫,對于待索引文本使用細(xì)粒度分詞算法進(jìn)行分詞拆分,并利用細(xì)粒度分詞結(jié)果將文本索引到ES;檢索時,對待檢索詞使用粗粒度分詞算法進(jìn)行分析,利用粗粒度分詞結(jié)果在ES索引庫中進(jìn)行檢索;根據(jù)ES的索引文本和用戶的檢索文本對詞庫進(jìn)行更新,自適應(yīng)地調(diào)整ES檢索和索引的分詞詞庫。本發(fā)明還提供了實(shí)現(xiàn)所述自適應(yīng)文本檢索的裝置。本發(fā)明所述的自適應(yīng)文本檢索方法和裝置可以無監(jiān)督地實(shí)時發(fā)現(xiàn)索引庫中的新詞、熱詞,并將其同步到ES檢索分詞庫中,從而更加準(zhǔn)確地對文本進(jìn)行分詞,不再依賴于用戶的手工添加,具有更強(qiáng)的實(shí)時性,提高了文本檢索的準(zhǔn)確性和效率。 |





