文本圖像與非文本圖像的分類(lèi)方法和分類(lèi)系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201610892308.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106503732A 公開(kāi)(公告)日 2017-03-15
申請(qǐng)公布號(hào) CN106503732A 申請(qǐng)公布日 2017-03-15
分類(lèi)號(hào) G06K9/62(2006.01)I;G06K9/34(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉寧;陳李江 申請(qǐng)(專(zhuān)利權(quán))人 淮北阿凡題教育科技有限公司
代理機(jī)構(gòu) 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京云江科技有限公司;淮北阿凡題教育科技有限公司
地址 100083 北京市海淀區(qū)五道口優(yōu)盛大廈A座1801室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種文本圖像與非文本圖像的分類(lèi)方法和分類(lèi)系統(tǒng)。其中,該方法可以包括獲取原始圖像的二值矩陣;統(tǒng)計(jì)二值矩陣中字符點(diǎn)所構(gòu)成的連通域,獲取符合第一預(yù)定要求的字符連通域的位置和大??;對(duì)文本行進(jìn)行劃分,得到文本行的個(gè)數(shù)和位置信息,以及文本行含有的字符連通域的個(gè)數(shù)和位置信息;提取原始圖像中的線段,并計(jì)算線段的傾斜角度及傾斜角度的中位數(shù);根據(jù)線段的傾斜角度及傾斜角度的中位數(shù),計(jì)算不符合第二預(yù)定要求的線段所占的比例;統(tǒng)計(jì)原始圖像的灰度空間和HSV空間中S通道的均值和方差;根據(jù)前述步驟的結(jié)果,利用樸素貝葉斯分類(lèi)模型實(shí)現(xiàn)原始圖像的分類(lèi)。由此,本發(fā)明實(shí)施例解決了如何準(zhǔn)確地從海量圖像中篩選出文本圖像的技術(shù)問(wèn)題。