一種基于文檔圖像版式自動(dòng)分析與判斷的方法

基本信息

申請(qǐng)?zhí)?/td> CN201711143809.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107798355A 公開(kāi)(公告)日 2018-03-13
申請(qǐng)公布號(hào) CN107798355A 申請(qǐng)公布日 2018-03-13
分類(lèi)號(hào) G06K9/62;G06K9/34 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫鑫;王長(zhǎng)征;劉文曉;趙勝男 申請(qǐng)(專(zhuān)利權(quán))人 山西同方知網(wǎng)數(shù)字出版技術(shù)有限公司
代理機(jī)構(gòu) 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司 代理人 山西同方知網(wǎng)數(shù)字出版技術(shù)有限公司
地址 030006 山西省太原市高新區(qū)產(chǎn)業(yè)路48號(hào)新島科技園D座
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于文檔圖像版式自動(dòng)分析與判斷的方法,包括:對(duì)圖像進(jìn)行預(yù)處理;對(duì)文檔圖像中文字區(qū)域水平方向進(jìn)行自動(dòng)檢測(cè);對(duì)文檔圖像中文字區(qū)域垂直方向進(jìn)行自動(dòng)檢測(cè);將文檔圖像中文字區(qū)域以行或列的屬性為基準(zhǔn),并根據(jù)水平方向和垂直方向的屬性檢測(cè),作出一系列的決策與分類(lèi);根據(jù)行和列在算法上的決策與分類(lèi),判斷文檔圖像中的版式。本發(fā)明通過(guò)文字區(qū)域自動(dòng)檢測(cè)、算法分析、橫版豎版結(jié)果判斷,以達(dá)到自動(dòng)化處理的要求,將結(jié)果分為橫版、豎版、無(wú)法判斷三類(lèi),版式判斷準(zhǔn)確無(wú)誤;其中,對(duì)于特殊圖像給出無(wú)法判斷的結(jié)果。版式分析為下一步文字識(shí)別提供了正確的識(shí)別條件和方向,提高了文字識(shí)別的正確率,增加了結(jié)果的準(zhǔn)確性。