一種文檔圖像分類(lèi)方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201811526387.9 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN109344815B | 公開(kāi)(公告)日 | 2021-08-13 |
| 申請(qǐng)公布號(hào) | CN109344815B | 申請(qǐng)公布日 | 2021-08-13 |
| 分類(lèi)號(hào) | G06K9/00;G06F16/35 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 侯進(jìn);黃賢俊 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京深智恒際科技有限公司 |
| 代理機(jī)構(gòu) | 北京匯信合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 孫民興 |
| 地址 | 100086 北京市海淀區(qū)知春路113號(hào)0706-003 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種文檔圖像分類(lèi)方法,包括:1、基于深度卷積神經(jīng)網(wǎng)絡(luò),對(duì)文檔圖像進(jìn)行圖像內(nèi)容特征提取;2、以1為輸入利用目標(biāo)檢測(cè)框架對(duì)文檔中的各關(guān)鍵信息條目位置進(jìn)行檢測(cè)回歸;3、通過(guò)2中回歸的各關(guān)鍵信息條目的坐標(biāo)信息,裁剪抽取出各關(guān)鍵信息條目所在位置對(duì)應(yīng)的圖像內(nèi)容特征的特征信息集合;4、基于2中檢測(cè)的各關(guān)鍵信息條目的相對(duì)位置關(guān)系,按照預(yù)設(shè)排序邏輯對(duì)3中提取的特征信息集合進(jìn)行順序重組;5、利用可變長(zhǎng)輸入的深度循環(huán)網(wǎng)絡(luò)對(duì)4中重組后的特征信息集合,進(jìn)行深度融合并最終給出文檔圖像的分類(lèi)結(jié)果。本發(fā)明利用CNN+RNN的技術(shù)巧妙地組合了圖像文本內(nèi)容特征和圖像中內(nèi)容的布局特征信息;整體精度能達(dá)到98%的準(zhǔn)確率。 |





