基于對比學習的文檔關系抽取方法及其相關設備

基本信息

申請?zhí)?/td> CN202111415292.1 申請日 -
公開(公告)號 CN114090792A 公開(公告)日 2022-02-25
申請公布號 CN114090792A 申請公布日 2022-02-25
分類號 G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王偉;黃勇其;于翠翠;張黔 申請(專利權)人 華潤數(shù)字科技有限公司
代理機構 深圳市世聯(lián)合知識產(chǎn)權代理有限公司 代理人 姜妍
地址 518000廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號深圳新一代產(chǎn)業(yè)園2棟801
法律狀態(tài) -

摘要

摘要 本申請實施例屬于人工智能技術領域,涉及一種基于對比學習的文檔關系抽取方法及其相關設備,包括基于語料文檔集合生成實體集合,基于知識庫確定實體集合的非知識庫實體;將非知識庫實體和知識庫實體輸入向量生成模型,獲得非知識庫實體表征向量和知識庫實體表征向量;確定非知識庫實體的替代實體;判斷實體集合中處于同一句子的實體是否存在關系標簽,若存在,獲取關系標簽,生成句子關系正樣本集合,若不存在,生成句子關系負樣本集合;訓練初始特征編碼器,獲得目標特征編碼器;將待分類句子輸入目標特征編碼器,獲得表征向量,將表征向量輸入關系分類器,獲得關系分類。本申請在減少樣本標注的同時,提高關系抽取的準確性。