一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201610393749.6 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN106055675A | 公開(公告)日 | 2016-10-26 |
| 申請(qǐng)公布號(hào) | CN106055675A | 申請(qǐng)公布日 | 2016-10-26 |
| 分類號(hào) | G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06N3/02(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 凌立剛;朱海鵬 | 申請(qǐng)(專利權(quán))人 | 杭州量知數(shù)據(jù)科技有限公司 |
| 代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 杭州量知數(shù)據(jù)科技有限公司 |
| 地址 | 310013 浙江省杭州市西湖區(qū)西溪路525號(hào)C樓492室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法。包括如下步驟:(1)將已有的少量關(guān)系映射成所需要的關(guān)系類型;(2)擴(kuò)展已有的關(guān)系中實(shí)體的不同表達(dá)方式;(3)從互聯(lián)網(wǎng)上獲取大量相關(guān)的非結(jié)構(gòu)化文本,并建立索引;(4)通過索引查詢與實(shí)體相關(guān)的句子,并分出正負(fù)樣本;(5)基于卷積神經(jīng)網(wǎng)絡(luò),將樣本轉(zhuǎn)換為特征向量;(6)利用獲取的特征向量,對(duì)文本進(jìn)行分類,得到新的關(guān)系對(duì)。本發(fā)明基于一個(gè)句子可能存在一種關(guān)系的假設(shè),從少量的已知關(guān)系開始,利用大量來自互聯(lián)網(wǎng)的非結(jié)構(gòu)化文本,獲取得到大量新的結(jié)構(gòu)化信息,也就是發(fā)現(xiàn)新的關(guān)系。 |





