一種內(nèi)容搜索方法及裝置

基本信息

申請?zhí)?/td> CN201910270479.3 申請日 -
公開(公告)號 CN109992647B 公開(公告)日 2021-11-12
申請公布號 CN109992647B 申請公布日 2021-11-12
分類號 G06F16/33(2019.01)I;G06F40/30(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 任寧;盧彥博;晉耀紅;李德彥 申請(專利權(quán))人 鼎富智能科技有限公司
代理機構(gòu) 北京弘權(quán)知識產(chǎn)權(quán)代理有限公司 代理人 逯長明;許偉群
地址 100089 北京市海淀區(qū)萬泉莊路28號萬柳新貴大廈A座6層630室
法律狀態(tài) -

摘要

摘要 本申請實施例提供了一種內(nèi)容搜索方法及裝置,能夠解析用戶輸入的搜索表達(dá)式,以獲取搜索表達(dá)式包含的關(guān)鍵字和距離約束條件;根據(jù)關(guān)鍵字從預(yù)處理的語料中獲取包含任意關(guān)鍵字的文章,得到文章集合;從文章集合中遍歷獲取同時包含所有關(guān)鍵字的句子,得到第一句子集合;根據(jù)搜索表達(dá)式對關(guān)鍵字形成的順序約束條件,從第一句子集合中獲取滿足順序約束條件的句子,得到第二句子集合;從第二句子集合中獲取滿足距離約束條件的句子,作為搜索目標(biāo)句。由此,通過對語料進行層層過濾,使篩選過后的語料在語義上逐漸收斂,使最終得到搜索目標(biāo)句在語義層面具有一致性。另外,通過對語料的層層過濾,逐漸縮小了語料規(guī)模,還提高了語料搜索速度和效率。