一種基于深度學習的從非結構化文本中獲取問答對的方法

基本信息

申請?zhí)?/td> CN201910220102.7 申請日 -
公開(公告)號 CN110110054A 公開(公告)日 2021-06-08
申請公布號 CN110110054A 申請公布日 2021-06-08
分類號 G06F16/332;G06F17/27;G06N3/04 分類 計算;推算;計數(shù);
發(fā)明人 王丙棟;朱江平;游世學 申請(專利權)人 北京中科匯聯(lián)科技股份有限公司
代理機構 北京慶峰財智知識產(chǎn)權代理事務所(普通合伙) 代理人 李文軍
地址 100094 北京市海淀區(qū)東北旺西路8號9號樓二區(qū)305
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度學習的從非結構化文本中獲取問答對的方法,包括如下步驟:文本規(guī)格化處理;基于深度神經(jīng)網(wǎng)絡模型進行句子分類和配對及關鍵短語提??;文本內部的問答對獲??;文本外部的問答對爬取;問答對匯總去重。本發(fā)明,針對問答對獲取困難的問題,通過有效利用容易獲取的非結構化文檔資源,結合使用深度神經(jīng)網(wǎng)絡模型,自動高效地獲取成規(guī)模的問答對,供人工校對、補充使用,降低了構建知識庫的成本,加快了構建知識庫的構建速度。