一種裁判文書(shū)實(shí)體關(guān)系抽取方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201911082739.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110837558A 公開(kāi)(公告)日 2020-02-25
申請(qǐng)公布號(hào) CN110837558A 申請(qǐng)公布日 2020-02-25
分類號(hào) G06F16/35;G06F40/295 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 不公告發(fā)明人 申請(qǐng)(專利權(quán))人 成都星云律例科技有限責(zé)任公司
代理機(jī)構(gòu) 成都行之專利代理事務(wù)所(普通合伙) 代理人 熊曦
地址 610000 四川省成都市高新區(qū)錦暉西一街99號(hào)2棟1單元19樓1909號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種裁判文書(shū)實(shí)體關(guān)系抽取方法及系統(tǒng),所述方法包括:設(shè)定樣本數(shù)據(jù)的格式;將訓(xùn)練樣本的格式轉(zhuǎn)換為樣本數(shù)據(jù)的格式,獲得格式轉(zhuǎn)換后的訓(xùn)練樣本;利用格式轉(zhuǎn)換后的訓(xùn)練樣本訓(xùn)練預(yù)訓(xùn)練模型bert,獲得訓(xùn)練后的模型bert;將待抽取實(shí)體關(guān)系的裁判文書(shū)句子輸入訓(xùn)練后的模型bert,輸出裁判文書(shū)句子中兩個(gè)實(shí)體之間的關(guān)系;在同等數(shù)據(jù)量情況下,本方法及系統(tǒng)效果優(yōu)于其他關(guān)系抽取模型;本方法及系統(tǒng)使用句子信息、實(shí)體信息、實(shí)體位置信息以及實(shí)體類型信息在模型中間拼接,符合關(guān)系抽取三元組的天然結(jié)構(gòu)。