融合知識圖譜的深度學習文本分類方法

基本信息

申請?zhí)?/td> CN202011097951.7 申請日 -
公開(公告)號 CN112597298A 公開(公告)日 2021-04-02
申請公布號 CN112597298A 申請公布日 2021-04-02
分類號 G06F16/36(2019.01)I;G06F40/295(2020.01)I;G06N3/08(2006.01)I;G06F16/35(2019.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉星辰;麻沁甜;陳曉峰 申請(專利權)人 上海勃池信息技術有限公司
代理機構 上海驍象知識產(chǎn)權代理有限公司 代理人 趙俊寅
地址 201815上海市嘉定區(qū)匯源路55號8幢5層517室
法律狀態(tài) -

摘要

摘要 融合知識圖譜的深度學習文本分類方法,包括以下步驟:提取待分類文本中的實體;利用已構建的知識圖譜,獲取實體相關隱含信息;將實體名稱和隱含信息轉換為格式化的文本,添加到原始文本的尾部,形成補充后的文本;對補充后的文本進行分詞處理,并預處理得到文本的分詞序列;查詢預設或隨機初始化的詞嵌入模型獲取分詞序列的詞嵌入矩陣,矩陣的每一行為各分詞的嵌入向量;將分詞序列的詞嵌入矩陣輸入深度學習文本分類算法,進行訓練或者預測。本發(fā)明克服現(xiàn)有技術的不足,將知識圖譜引入到深度學習的文本分類中,通過從知識圖譜中查詢隱含信息并轉換為格式化文本,對原始文本進行信息補充,從而提升深度學習文本分類的準確性。??