一種基于多模態(tài)融合的文檔版面分類方法
基本信息

| 申請?zhí)?/td> | CN202110854557.1 | 申請日 | - |
| 公開(公告)號 | CN113688872A | 公開(公告)日 | 2021-11-23 |
| 申請公布號 | CN113688872A | 申請公布日 | 2021-11-23 |
| 分類號 | G06K9/62;G06K9/00 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 陶提;許諾;高翔;紀達麒;陳運文 | 申請(專利權)人 | 達觀數(shù)據(jù)(蘇州)有限公司 |
| 代理機構 | 上海智力專利商標事務所(普通合伙) | 代理人 | 張文玄;周濤 |
| 地址 | 215133 江蘇省蘇州市相城區(qū)相城大道1168號品上商業(yè)中心5幢908室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于多模態(tài)融合的文檔版面分類方法,其特征在于,針對目標文檔,包括:檢測目標文檔,獲取待分類的檢測框;獲取檢測框的文本信息、框坐標信息和圖像特征;采用多模態(tài)融合模型,以所述文本信息、框坐標信息和圖像特征作為輸入,輸出檢測框的類型。本發(fā)明通過將文本、位置和圖像信息的多模態(tài)融合,提升了文檔版面分類的準確率。 |





