OCR模型訓(xùn)練方法、系統(tǒng)及裝置
基本信息

| 申請?zhí)?/td> | CN202011307368.4 | 申請日 | - |
| 公開(公告)號 | CN112418304B | 公開(公告)日 | 2021-10-29 |
| 申請公布號 | CN112418304B | 申請公布日 | 2021-10-29 |
| 分類號 | G06K9/62(2006.01)I;G06K9/34(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 司法 | 申請(專利權(quán))人 | 北京云從科技有限公司 |
| 代理機構(gòu) | 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 宋寶庫;王天騏 |
| 地址 | 102300北京市門頭溝區(qū)石龍經(jīng)濟開發(fā)區(qū)永安路20號3號樓一層102室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,具體提供一種OCR模型訓(xùn)練方法、系統(tǒng)及裝置。本發(fā)明旨在解決目前較少數(shù)量的圖像樣本無法使OCR模型的準(zhǔn)確度達到較高水平的問題。為此目的,本發(fā)明通過首先對初始圖像樣本進行標(biāo)注并生成第一OCR訓(xùn)練集,再在訓(xùn)練模型中輸入第一OCR訓(xùn)練集進行訓(xùn)練,得到第一OCR模型,將實物圖像樣本輸入第一OCR模型進行識別,根據(jù)識別結(jié)果獲得實物圖像樣本中被識別錯誤的圖像樣本,將被識別的錯誤的圖像樣本匯總為第一補充OCR訓(xùn)練集,并分配第一OCR訓(xùn)練集與第一補充OCR訓(xùn)練集的權(quán)重,合并后生成第一優(yōu)化OCR訓(xùn)練集,在第一OCR模型中輸入第一優(yōu)化OCR訓(xùn)練集進行訓(xùn)練,以得到準(zhǔn)確度更高的第一優(yōu)化OCR模型進行字符識別。 |





