一種用于知識圖譜語義搜索的文本理解的方法

基本信息

申請?zhí)?/td> CN202110870572.5 申請日 -
公開(公告)號 CN113688233A 公開(公告)日 2021-11-23
申請公布號 CN113688233A 申請公布日 2021-11-23
分類號 G06F16/35;G06F16/36;G06F16/33;G06K9/62;G06N3/04 分類 計算;推算;計數(shù);
發(fā)明人 陳運文;王文廣;賀夢潔;紀(jì)達(dá)麒;桂洪冠;金克;馮佳妮;紀(jì)傳俊 申請(專利權(quán))人 達(dá)觀數(shù)據(jù)(蘇州)有限公司
代理機構(gòu) 上海智力專利商標(biāo)事務(wù)所(普通合伙) 代理人 張文玄;周濤
地址 215133 江蘇省蘇州市相城區(qū)相城大道1168號品上商業(yè)中心5幢908室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用于知識圖譜語義搜索的文本理解的方法,針對輸入的待理解的文本,所述方法包括如下步驟:通過大規(guī)模預(yù)訓(xùn)練模型獲得文本中每個詞元的語義信息,生成語義向量;基于所述語義向量,通過卷積神經(jīng)網(wǎng)絡(luò)、實體分類用的第一softmax分類器和關(guān)系分類用的第二softmax分類器,識別出實體類型和關(guān)系類型;基于所述語義向量,通過CRF進(jìn)行序列標(biāo)注,抽取出實體;基于所述語義向量,通過Bi?LSTM模型和問句分類用的第三softmax分類器,將文本進(jìn)行分類;基于識別出的實體類型和關(guān)系類型、抽取出的實體、文本的分類結(jié)果,檢索知識圖譜獲取信息作為反饋。本發(fā)明使用統(tǒng)一的方法同時完成了四種任務(wù),使得系統(tǒng)更加簡潔。