文本識(shí)別及模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息

| 申請?zhí)?/td> | CN202110464194.0 | 申請日 | - |
| 公開(公告)號 | CN113221879A | 公開(公告)日 | 2021-08-06 |
| 申請公布號 | CN113221879A | 申請公布日 | 2021-08-06 |
| 分類號 | G06K9/32(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 鄔國銳;卿山;王慶慶 | 申請(專利權(quán))人 | 北京愛咔咔信息技術(shù)有限公司 |
| 代理機(jī)構(gòu) | 北京致科知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李洪娟;魏紅雅 |
| 地址 | 100085北京市海淀區(qū)安寧莊路26號樓2層216 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種文本識(shí)別及模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該方法包括:獲取待識(shí)別圖像的包含空間位置信息的第一圖像特征;采用自注意力機(jī)制對所述第一圖像特征進(jìn)行優(yōu)化,獲得第二圖像特征;將所述第一圖像特征和所述第二圖像特征進(jìn)行融合,獲得第三圖像特征;對所述第三圖像特征進(jìn)行解碼處理,獲得識(shí)別結(jié)果。本發(fā)明通過采用自注意力機(jī)制對包含空間位置信息的圖像特征進(jìn)優(yōu)化,并將優(yōu)化后的圖像特征與優(yōu)化前的圖像特征融合后再進(jìn)行解碼,融合特征有效保留了優(yōu)化前圖像特征的原始視覺特征并增加了空間依賴性信息,從而具有更好的表示能力,更有助于解碼階段的對齊操作,有效降低了注意力偏移問題,從而提高識(shí)別結(jié)果的準(zhǔn)確性。 |





