一種文本識別方法及系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN202110463484.3 | 申請日 | - |
| 公開(公告)號 | CN112862024B | 公開(公告)日 | 2021-09-21 |
| 申請公布號 | CN112862024B | 申請公布日 | 2021-09-21 |
| 分類號 | G06K9/62(2006.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 姚娟娟;鐘南山 | 申請(專利權)人 | 明品云(北京)數(shù)據(jù)科技有限公司 |
| 代理機構(gòu) | 上海漢之律師事務所 | 代理人 | 馬婷婷 |
| 地址 | 102400北京市房山區(qū)長陽萬興路86號-N3557 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種文本識別方法及系統(tǒng),文本識別方法包括:采集圖像樣本集,圖像樣本集包括:數(shù)據(jù)來源標簽;根據(jù)數(shù)據(jù)來源標簽,將圖像樣本集輸入文本識別網(wǎng)絡進行訓練,獲取文本識別模型,文本識別模型包括:手寫字體識別模型和印刷字體識別模型;獲取待識別圖像;將待識別圖像輸入文本識別模型進行文本識別,獲取文本識別結(jié)果;將文本識別結(jié)果輸入語義標簽提取模型進行語義標簽提取,獲取文本識別結(jié)果中的文本向量的語義標簽;根據(jù)語義標簽,對文本識別結(jié)果進行更新,完成文本識別;本發(fā)明中的方法,通過獲取手寫字體識別模型和印刷字體識別模型,能夠?qū)ΥR別圖像進行較準確地識別,通過提取語義標簽,對文本識別結(jié)果進行更新,提高識別精確度。 |





