一種中文命名實(shí)體的識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN201911173134.2 申請(qǐng)日 -
公開(公告)號(hào) CN111091002A 公開(公告)日 2020-05-01
申請(qǐng)公布號(hào) CN111091002A 申請(qǐng)公布日 2020-05-01
分類號(hào) G06F40/295;G06F40/211;G06F16/951;G06F16/33 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱鵬;程大偉;楊芳洲;羅軼鳳;錢衛(wèi)寧;周傲英 申請(qǐng)(專利權(quán))人 上海瞰點(diǎn)科技有限責(zé)任公司
代理機(jī)構(gòu) 上海藍(lán)迪專利商標(biāo)事務(wù)所(普通合伙) 代理人 華東師范大學(xué);上海瞰點(diǎn)科技有限責(zé)任公司
地址 200241 上海市閔行區(qū)東川路500號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種中文命名實(shí)體的識(shí)別方法,其特點(diǎn)是采用CWS和POS標(biāo)簽信息用于單詞關(guān)系推斷,通過對(duì)抗學(xué)習(xí)中包含的NER、CWS和POS標(biāo)記任務(wù)中提取與實(shí)體邊界有關(guān)的公共信息,以及多任務(wù)學(xué)習(xí)把NER、CWS和POS三個(gè)任務(wù)放在一起訓(xùn)練,其中每個(gè)任務(wù)都含有多個(gè)自我注意力機(jī)制的組件,以便從各種嵌入中提取特定任務(wù)的特定信息,并將該信息與從對(duì)抗學(xué)習(xí)中獲得的通用信息進(jìn)行適當(dāng)組合來(lái)識(shí)別實(shí)體。本發(fā)明與現(xiàn)有技術(shù)相比具有為中文里面的實(shí)體識(shí)別和應(yīng)用工作提供了一個(gè)新的解決方案,方法簡(jiǎn)便,效率高。