一種半結(jié)構(gòu)文本的信息提取裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110414726.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113326690A 公開(kāi)(公告)日 2021-08-31
申請(qǐng)公布號(hào) CN113326690A 申請(qǐng)公布日 2021-08-31
分類號(hào) G06F40/205(2020.01)I;G06F40/284(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周靖宇;袁陽(yáng)平;劉宇軒;景泳霖;鄒鴻岳 申請(qǐng)(專利權(quán))人 北京快確信息科技有限公司
代理機(jī)構(gòu) 深圳華屹智林知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 陳裕恒
地址 201700上海市青浦區(qū)浦倉(cāng)路485號(hào)1幢2層
法律狀態(tài) -

摘要

摘要 一種半結(jié)構(gòu)文本的信息提取裝置,它涉及AI技術(shù)領(lǐng)域,具體涉及一種半結(jié)構(gòu)文本的信息提取裝置。它包括了對(duì)句子的分詞和結(jié)構(gòu)提??;編碼層模塊,采用Albert或LSTM對(duì)文本的字符進(jìn)行embedding;圖注意力網(wǎng)絡(luò)結(jié)構(gòu)層,用于將融合了“結(jié)構(gòu)特征”的詞向量融合到“字符”向量的表達(dá)上;不同粒度特征的聚合層,采用transformer的decoder方式進(jìn)行聚合;解碼層,采用成熟的CRF算法,對(duì)編碼結(jié)果R進(jìn)行解碼,獲得最終序列標(biāo)注的結(jié)果。采用上述技術(shù)方案后,本發(fā)明有益效果為:它能夠?qū)崿F(xiàn)對(duì)文本中“結(jié)構(gòu)特征”的學(xué)習(xí),在針對(duì)金融領(lǐng)域的數(shù)據(jù)抽取中能提升2%?5%以上的準(zhǔn)確率。