一種文檔圖像分類(lèi)方法

基本信息

申請(qǐng)?zhí)?/td> CN201811526387.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109344815B 公開(kāi)(公告)日 2021-08-13
申請(qǐng)公布號(hào) CN109344815B 申請(qǐng)公布日 2021-08-13
分類(lèi)號(hào) G06K9/00;G06F16/35 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 侯進(jìn);黃賢俊 申請(qǐng)(專(zhuān)利權(quán))人 北京深智恒際科技有限公司
代理機(jī)構(gòu) 北京匯信合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 孫民興
地址 100086 北京市海淀區(qū)知春路113號(hào)0706-003
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種文檔圖像分類(lèi)方法,包括:1、基于深度卷積神經(jīng)網(wǎng)絡(luò),對(duì)文檔圖像進(jìn)行圖像內(nèi)容特征提取;2、以1為輸入利用目標(biāo)檢測(cè)框架對(duì)文檔中的各關(guān)鍵信息條目位置進(jìn)行檢測(cè)回歸;3、通過(guò)2中回歸的各關(guān)鍵信息條目的坐標(biāo)信息,裁剪抽取出各關(guān)鍵信息條目所在位置對(duì)應(yīng)的圖像內(nèi)容特征的特征信息集合;4、基于2中檢測(cè)的各關(guān)鍵信息條目的相對(duì)位置關(guān)系,按照預(yù)設(shè)排序邏輯對(duì)3中提取的特征信息集合進(jìn)行順序重組;5、利用可變長(zhǎng)輸入的深度循環(huán)網(wǎng)絡(luò)對(duì)4中重組后的特征信息集合,進(jìn)行深度融合并最終給出文檔圖像的分類(lèi)結(jié)果。本發(fā)明利用CNN+RNN的技術(shù)巧妙地組合了圖像文本內(nèi)容特征和圖像中內(nèi)容的布局特征信息;整體精度能達(dá)到98%的準(zhǔn)確率。