一種面向醫(yī)療領(lǐng)域基于深度學習的命名實體識別方法

基本信息

申請?zhí)?/td> CN201610590151.6 申請日 -
公開(公告)號 CN106202054B 公開(公告)日 2018-12-14
申請公布號 CN106202054B 申請公布日 2018-12-14
分類號 G06F17/27;G16H70/40 分類 計算;推算;計數(shù);
發(fā)明人 朱聰慧;趙鐵軍;楊沐昀;徐冰;曹海龍;鄭德權(quán) 申請(專利權(quán))人 哈爾濱工業(yè)大學國家大學科技園發(fā)展有限公司
代理機構(gòu) 哈爾濱市松花江專利商標事務所 代理人 哈爾濱工業(yè)大學;哈爾濱工業(yè)大學國家大學科技園發(fā)展有限公司;深圳高性能醫(yī)療器械國家研究院有限公司
地址 150001 黑龍江省哈爾濱市南崗區(qū)西大直街92號
法律狀態(tài) -

摘要

摘要 一種面向醫(yī)療領(lǐng)域基于深度學習的命名實體識別方法,本發(fā)明涉及命名實體識別方法。本發(fā)明是要解決CRF模型由于不考慮語義信息,在訓練語料極度缺乏的情況下,標注結(jié)果中會出現(xiàn)大量的無意義的標注結(jié)果的問題,而提出的一種面向醫(yī)療領(lǐng)域基于深度學習的命名實體識別方法。該方法是通過一、得到了補充醫(yī)療領(lǐng)域語料的詞表voc和詞表voc對應的詞向量vec;二、利用有標注語料中的訓練語料進行長短期記憶單元網(wǎng)絡LSTM的訓練;三、根據(jù)二中的更新的神經(jīng)網(wǎng)絡參數(shù)θ進行標注結(jié)果的路徑查找,得到有標注語料的標注結(jié)果;利用命名實體識別評估標準F值對有標注語料中的測試語料的標注結(jié)果進行評估等步驟實現(xiàn)的。本發(fā)明應用于命名實體識別領(lǐng)域。