界面文字識別方法

基本信息

申請?zhí)?/td> CN202111019211.6 申請日 -
公開(公告)號 CN113780293A 公開(公告)日 2021-12-10
申請公布號 CN113780293A 申請公布日 2021-12-10
分類號 G06K9/34(2006.01)I;G06K9/32(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王彥瑞 申請(專利權(quán))人 德訊創(chuàng)新(北京)科技有限公司
代理機(jī)構(gòu) 南京利豐知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 陳志軍
地址 100053北京市西城區(qū)宣武門外大街6、8、10、12、16、18號10號樓15層1525室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種界面文字識別方法,涉及文字識別技術(shù)領(lǐng)域,包括獲取圖像;對所述圖像進(jìn)行預(yù)處理,得到待識別圖像;對所述待識別圖像進(jìn)行版面分析,根據(jù)屬性將所述待識別圖像分割為不同部分,并標(biāo)定各部分的屬性;對標(biāo)定為文字的圖像部分進(jìn)行圖像切分,以切分出獨(dú)立的個(gè)體文字;對所述個(gè)體文字進(jìn)行特征提取,并將提取到的特征與已有特征庫內(nèi)中的特征進(jìn)行比對,確定相似度最高的特征所對應(yīng)的文字,并作為識別文字。本發(fā)明不僅使文字識別的準(zhǔn)確度更高,而且可適用于較為復(fù)雜的圖文場景的文字識別,同時(shí),可根據(jù)版面信息進(jìn)行重構(gòu),便于后續(xù)的處理。