一種手寫英文行識別系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN202210217783.3 | 申請日 | - |
| 公開(公告)號 | CN114299510A | 公開(公告)日 | 2022-04-08 |
| 申請公布號 | CN114299510A | 申請公布日 | 2022-04-08 |
| 分類號 | G06V30/22(2022.01)I;G06V10/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 許信順;譚玉慧;馬磊;陳義學 | 申請(專利權)人 | 山東山大鷗瑪軟件股份有限公司 |
| 代理機構(gòu) | 山東舜源聯(lián)合知識產(chǎn)權代理有限公司 | 代理人 | 馬洪磊 |
| 地址 | 250101山東省濟南市高新區(qū)伯樂路128號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提出的一種手寫英文行識別系統(tǒng),屬于文本識別技術領域。包括:視覺模塊、語義模塊和融合模塊;視覺模塊,用于使用ResNet網(wǎng)絡提取手寫英文行的文本圖像的空間特征,并使用基于CTC和基于Attention的模型進行解碼,輸出字符級解碼和單詞級解碼;語義模塊,用于使用視覺模塊中輸出的基于Attention的字符級解碼的輸出概率作為輸入,通過使用梯度截斷策略,以糾正預測序列的方式顯式學習英文行中潛在的語義信息;融合模塊,用于通過使用門機制將視覺模塊提取到的視覺信息和語義模塊提取到的語義信息進行結(jié)合,以生成預測結(jié)果。 |





