一種文本識別方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110463484.3 申請日 -
公開(公告)號 CN112862024B 公開(公告)日 2021-09-21
申請公布號 CN112862024B 申請公布日 2021-09-21
分類號 G06K9/62(2006.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 姚娟娟;鐘南山 申請(專利權)人 明品云(北京)數(shù)據(jù)科技有限公司
代理機構(gòu) 上海漢之律師事務所 代理人 馬婷婷
地址 102400北京市房山區(qū)長陽萬興路86號-N3557
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文本識別方法及系統(tǒng),文本識別方法包括:采集圖像樣本集,圖像樣本集包括:數(shù)據(jù)來源標簽;根據(jù)數(shù)據(jù)來源標簽,將圖像樣本集輸入文本識別網(wǎng)絡進行訓練,獲取文本識別模型,文本識別模型包括:手寫字體識別模型和印刷字體識別模型;獲取待識別圖像;將待識別圖像輸入文本識別模型進行文本識別,獲取文本識別結(jié)果;將文本識別結(jié)果輸入語義標簽提取模型進行語義標簽提取,獲取文本識別結(jié)果中的文本向量的語義標簽;根據(jù)語義標簽,對文本識別結(jié)果進行更新,完成文本識別;本發(fā)明中的方法,通過獲取手寫字體識別模型和印刷字體識別模型,能夠?qū)ΥR別圖像進行較準確地識別,通過提取語義標簽,對文本識別結(jié)果進行更新,提高識別精確度。