一種多規(guī)格文本協(xié)同定位和提取方法

基本信息

申請(qǐng)?zhí)?/td> CN201711360636.7 申請(qǐng)日 -
公開(公告)號(hào) CN108875721A 公開(公告)日 2018-11-23
申請(qǐng)公布號(hào) CN108875721A 申請(qǐng)公布日 2018-11-23
分類號(hào) G06K9/20;G06K9/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 嚴(yán)京旗;張成棟;李進(jìn)文;羅寶娟 申請(qǐng)(專利權(quán))人 南通艾思達(dá)智能科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 226299 江蘇省南通市開發(fā)區(qū)海德路2號(hào)1幢110490室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種多規(guī)格文本協(xié)同定位和提取方法,包括如下步驟:步驟110獲取文本圖像數(shù)據(jù);步驟120、圖像歸一化操作;步驟130、分離圖像背景信息和需要采集的前景信息;步驟140、全局協(xié)同搜索,提取出預(yù)設(shè)格式的各個(gè)文本塊區(qū)域;步驟150、局部?jī)?yōu)化搜索,在小范圍內(nèi)逐個(gè)優(yōu)化各個(gè)文本區(qū)域的位置;步驟160輸出各個(gè)文本塊定位結(jié)果,提供給后續(xù)單字切分和識(shí)別模塊。本發(fā)明利用圖像處理、目標(biāo)檢測(cè)、協(xié)同搜索、局部?jī)?yōu)化等技術(shù),滿足格式化數(shù)據(jù)采集的要求,克服某些文本塊退化后的漏檢和錯(cuò)檢問題并最大程度避免不必要的文本和噪聲信息的干擾,提高格式化文本信息采集的準(zhǔn)度和精度。