一種面向自然語言搜索結構化數據的詞義積累及分詞方法、工具和系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN201911372759.1 | 申請日 | - |
| 公開(公告)號 | CN113051898A | 公開(公告)日 | 2021-06-29 |
| 申請公布號 | CN113051898A | 申請公布日 | 2021-06-29 |
| 分類號 | G06F40/247;G06F40/295;G06F16/332;G06F16/36 | 分類 | 計算;推算;計數; |
| 發(fā)明人 | 余宙;楊永智;陳文佳 | 申請(專利權)人 | 北京阿博茨科技有限公司 |
| 代理機構 | 國浩律師(南京)事務所 | 代理人 | 孟睿;孔劍凡 |
| 地址 | 100194 北京市海淀區(qū)蘇家坨鎮(zhèn)西小營南環(huán)10號院1幢1115號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種面向自然語言搜索結構化數據的詞義積累及分詞方法、工具和系統(tǒng)。在配置庫中定義虛擬維度數據,并更新詞典;在配置庫中,每一類實體各有一張?zhí)摂M維度表,所述虛擬維度表包含實體名稱列和維度列,在所述虛擬維度表中定義虛擬維度數據;在搜索結構化數據過程中,對用戶輸入的自然語言,先使用個人詞典分詞,對個人詞典未識別出的詞,再使用系統(tǒng)詞典進行分詞,從而將用戶輸入的自然語言轉譯為數據庫查詢語言;當超過N個個人字典將對同一個詞定義了相同的詞義,則將該詞的詞義從人字典同步至系統(tǒng)詞典。本發(fā)明詞義積累準確、快速。 |





