一種基于深度學習的從非結構化文本中獲取問答對的方法
基本信息

| 申請?zhí)?/td> | CN201910220102.7 | 申請日 | - |
| 公開(公告)號 | CN110110054A | 公開(公告)日 | 2021-06-08 |
| 申請公布號 | CN110110054A | 申請公布日 | 2021-06-08 |
| 分類號 | G06F16/332;G06F17/27;G06N3/04 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 王丙棟;朱江平;游世學 | 申請(專利權)人 | 北京中科匯聯(lián)科技股份有限公司 |
| 代理機構 | 北京慶峰財智知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 李文軍 |
| 地址 | 100094 北京市海淀區(qū)東北旺西路8號9號樓二區(qū)305 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種基于深度學習的從非結構化文本中獲取問答對的方法,包括如下步驟:文本規(guī)格化處理;基于深度神經(jīng)網(wǎng)絡模型進行句子分類和配對及關鍵短語提??;文本內部的問答對獲??;文本外部的問答對爬取;問答對匯總去重。本發(fā)明,針對問答對獲取困難的問題,通過有效利用容易獲取的非結構化文檔資源,結合使用深度神經(jīng)網(wǎng)絡模型,自動高效地獲取成規(guī)模的問答對,供人工校對、補充使用,降低了構建知識庫的成本,加快了構建知識庫的構建速度。 |





