用于OCR識(shí)別的數(shù)據(jù)增廣方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110991555.7 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN113435426A | 公開(公告)日 | 2021-09-24 |
| 申請(qǐng)公布號(hào) | CN113435426A | 申請(qǐng)公布日 | 2021-09-24 |
| 分類號(hào) | G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06F40/216(2020.01)I;G06F40/242(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 不公告發(fā)明人 | 申請(qǐng)(專利權(quán))人 | 珠海億智電子科技有限公司 |
| 代理機(jī)構(gòu) | 深圳青年人專利商標(biāo)代理有限公司 | 代理人 | 吳桂華 |
| 地址 | 519000廣東省珠海市高新區(qū)唐家灣鎮(zhèn)港樂路8號(hào)大洲科技園B區(qū)廠房803室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明適用于字符識(shí)別技術(shù)領(lǐng)域,提供了一種用于OCR識(shí)別的數(shù)據(jù)增廣方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該方法包括:通過建立識(shí)別字典,基于識(shí)別字典和已獲取的開源數(shù)據(jù)集建立第一詞頻字典,基于第一詞頻字典建立合成數(shù)據(jù)集文本文檔,基于已建立的數(shù)據(jù)集屬性、OCR識(shí)別的應(yīng)用場(chǎng)景以及合成數(shù)據(jù)集文本文檔對(duì)當(dāng)前數(shù)據(jù)集進(jìn)行數(shù)據(jù)增廣,得到增廣后的基礎(chǔ)數(shù)據(jù)集,從而在降低OCR深度算法中獲取訓(xùn)練樣本的成本的同時(shí),提高了數(shù)據(jù)增廣的針對(duì)性。 |





