一種基于深度學習的命名實體關系抽取與構建方法
基本信息

| 申請?zhí)?/td> | CN201410488047.7 | 申請日 | - |
| 公開(公告)號 | CN104199972B | 公開(公告)日 | 2018-08-03 |
| 申請公布號 | CN104199972B | 申請公布日 | 2018-08-03 |
| 分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 袁偉;鄧攀;閆碧瑩;趙鑫;李玉成;余雷 | 申請(專利權)人 | 中科嘉速(北京)信息技術有限公司 |
| 代理機構 | 北京永創(chuàng)新實專利事務所 | 代理人 | 中科嘉速(北京)信息技術有限公司 |
| 地址 | 100190 北京市海淀區(qū)中關村南四街4號5號樓502室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了一種基于深度學習的命名實體關系抽取與構建方法,用于互聯(lián)網(wǎng)信息技術領域。本方法針對某一特定領域,在垂直網(wǎng)站上抓取領域內(nèi)的新聞數(shù)據(jù),對獲取的新聞數(shù)據(jù)進行預處理;新聞數(shù)據(jù)分詞,抽取關鍵詞,生成行業(yè)詞庫,利用行業(yè)詞庫對新聞數(shù)據(jù)重新分詞;抽取種子詞庫;無監(jiān)督構建實體關系網(wǎng)絡,從新聞數(shù)據(jù)中抽取包含兩個以上實體的句子,抽取句子中的動詞以及對應的文檔,對抽取的文檔建立基于深度學習的詞聚類模型,根據(jù)動詞描述的詞之間的關系,構建實體關系網(wǎng)絡;定義實體關系類別,對實體關系網(wǎng)絡中的每個實體對,進行關系分類。本發(fā)明不需投入大規(guī)模人力對樣本數(shù)據(jù)進行標記,語料庫的依賴性低,抽取實體關系的性能高。 |





