一種半結(jié)構(gòu)文本的信息提取裝置
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110414726.X | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113326690A | 公開(kāi)(公告)日 | 2021-08-31 |
| 申請(qǐng)公布號(hào) | CN113326690A | 申請(qǐng)公布日 | 2021-08-31 |
| 分類號(hào) | G06F40/205(2020.01)I;G06F40/284(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 周靖宇;袁陽(yáng)平;劉宇軒;景泳霖;鄒鴻岳 | 申請(qǐng)(專利權(quán))人 | 北京快確信息科技有限公司 |
| 代理機(jī)構(gòu) | 深圳華屹智林知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 陳裕恒 |
| 地址 | 201700上海市青浦區(qū)浦倉(cāng)路485號(hào)1幢2層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種半結(jié)構(gòu)文本的信息提取裝置,它涉及AI技術(shù)領(lǐng)域,具體涉及一種半結(jié)構(gòu)文本的信息提取裝置。它包括了對(duì)句子的分詞和結(jié)構(gòu)提??;編碼層模塊,采用Albert或LSTM對(duì)文本的字符進(jìn)行embedding;圖注意力網(wǎng)絡(luò)結(jié)構(gòu)層,用于將融合了“結(jié)構(gòu)特征”的詞向量融合到“字符”向量的表達(dá)上;不同粒度特征的聚合層,采用transformer的decoder方式進(jìn)行聚合;解碼層,采用成熟的CRF算法,對(duì)編碼結(jié)果R進(jìn)行解碼,獲得最終序列標(biāo)注的結(jié)果。采用上述技術(shù)方案后,本發(fā)明有益效果為:它能夠?qū)崿F(xiàn)對(duì)文本中“結(jié)構(gòu)特征”的學(xué)習(xí),在針對(duì)金融領(lǐng)域的數(shù)據(jù)抽取中能提升2%?5%以上的準(zhǔn)確率。 |





