OCR模型訓(xùn)練方法、系統(tǒng)及裝置

基本信息

申請?zhí)?/td> CN202011307368.4 申請日 -
公開(公告)號 CN112418304B 公開(公告)日 2021-10-29
申請公布號 CN112418304B 申請公布日 2021-10-29
分類號 G06K9/62(2006.01)I;G06K9/34(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 司法 申請(專利權(quán))人 北京云從科技有限公司
代理機構(gòu) 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 宋寶庫;王天騏
地址 102300北京市門頭溝區(qū)石龍經(jīng)濟開發(fā)區(qū)永安路20號3號樓一層102室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,具體提供一種OCR模型訓(xùn)練方法、系統(tǒng)及裝置。本發(fā)明旨在解決目前較少數(shù)量的圖像樣本無法使OCR模型的準(zhǔn)確度達到較高水平的問題。為此目的,本發(fā)明通過首先對初始圖像樣本進行標(biāo)注并生成第一OCR訓(xùn)練集,再在訓(xùn)練模型中輸入第一OCR訓(xùn)練集進行訓(xùn)練,得到第一OCR模型,將實物圖像樣本輸入第一OCR模型進行識別,根據(jù)識別結(jié)果獲得實物圖像樣本中被識別錯誤的圖像樣本,將被識別的錯誤的圖像樣本匯總為第一補充OCR訓(xùn)練集,并分配第一OCR訓(xùn)練集與第一補充OCR訓(xùn)練集的權(quán)重,合并后生成第一優(yōu)化OCR訓(xùn)練集,在第一OCR模型中輸入第一優(yōu)化OCR訓(xùn)練集進行訓(xùn)練,以得到準(zhǔn)確度更高的第一優(yōu)化OCR模型進行字符識別。