一種語義搜索的實現(xiàn)方法、系統(tǒng)、計算機設備和存儲介質

基本信息

申請?zhí)?/td> CN202111683267.1 申請日 -
公開(公告)號 CN114490928A 公開(公告)日 2022-05-13
申請公布號 CN114490928A 申請公布日 2022-05-13
分類號 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳開冉;黎展;黃俊強;方燁封 申請(專利權)人 廣州探跡科技有限公司
代理機構 廣州三環(huán)專利商標代理有限公司 代理人 -
地址 510000廣東省廣州市番禺區(qū)小谷圍街青藍街26號503
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語義搜索的實現(xiàn)方法。包括:將待識別文本輸入第一NER模型,得到文本片段標記序列;將片段輸入第二NER模型,得到片段實體標記序列;使用預設分類符號和預設節(jié)點數(shù)據(jù)按照預設規(guī)則分別對文本片段標記序列和片段實體標記序列進行格式轉換,得到文本關系樹葉節(jié)點序列和片段關系樹葉節(jié)點序列;分別輸入關系樹生成模型,得到文本父節(jié)點坐標序列和片段父節(jié)點坐標序列;分別生成對應的文本關系樹結構和片段關系樹結構;使用所述片段關系樹結構替換所述文本關系樹結構中所述包含實體的上下文片段對應的葉節(jié)點,生成語義搜索關系樹結構。本發(fā)明能夠增強語義搜索的泛化性,應對復雜查詢邏輯的魯棒性,提高長難語句的識別精度。