一種基于深度學(xué)習(xí)的OCR方法
基本信息

| 申請?zhí)?/td> | CN201811257203.3 | 申請日 | - |
| 公開(公告)號 | CN109376658B | 公開(公告)日 | 2022-03-08 |
| 申請公布號 | CN109376658B | 申請公布日 | 2022-03-08 |
| 分類號 | G06V30/41(2022.01)I;G06V30/19(2022.01)I;G06V30/26(2022.01)I;G06V30/148(2022.01)I;G06V30/168(2022.01)I;G06V30/18(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 王慜驪;林路;桂曉雷;安通鑒;林康;陳立強 | 申請(專利權(quán))人 | 信雅達科技股份有限公司 |
| 代理機構(gòu) | 杭州裕陽聯(lián)合專利代理有限公司 | 代理人 | 張解翠 |
| 地址 | 310051 浙江省杭州市濱江區(qū)江南大道3888號信雅達科技大廈 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于深度學(xué)習(xí)的OCR方法,包含如下步驟:獲取待識別圖像;對待識別圖像進行縮放,然后對縮放后的圖像進行預(yù)處理,所述的預(yù)處理為銳化、灰度化、二值化、矯正傾斜、降噪、去公章中的任意一項或多項;將預(yù)處理后的圖像放入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,得到縮放處理后圖像的多個候選文本區(qū)域;將縮放處理后圖像的多個候選文本區(qū)域放入基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,將候選文字區(qū)域中的內(nèi)容轉(zhuǎn)換為計算機可讀的文本;將上述計算機可讀的文本放入深度學(xué)習(xí)語言模型中,對文本識別結(jié)果進行校正。本發(fā)明可以實現(xiàn)影像的文字內(nèi)容的智能提取,為各行業(yè)人員提供了快速檢索以及快速獲取信息的服務(wù),提升了工作效率,識別字段準(zhǔn)確率高,提高處理速度。 |





