一種基于多模態(tài)融合的文檔版面分類方法

基本信息

申請?zhí)?/td> CN202110854557.1 申請日 -
公開(公告)號 CN113688872A 公開(公告)日 2021-11-23
申請公布號 CN113688872A 申請公布日 2021-11-23
分類號 G06K9/62;G06K9/00 分類 計算;推算;計數(shù);
發(fā)明人 陶提;許諾;高翔;紀達麒;陳運文 申請(專利權)人 達觀數(shù)據(jù)(蘇州)有限公司
代理機構 上海智力專利商標事務所(普通合伙) 代理人 張文玄;周濤
地址 215133 江蘇省蘇州市相城區(qū)相城大道1168號品上商業(yè)中心5幢908室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于多模態(tài)融合的文檔版面分類方法,其特征在于,針對目標文檔,包括:檢測目標文檔,獲取待分類的檢測框;獲取檢測框的文本信息、框坐標信息和圖像特征;采用多模態(tài)融合模型,以所述文本信息、框坐標信息和圖像特征作為輸入,輸出檢測框的類型。本發(fā)明通過將文本、位置和圖像信息的多模態(tài)融合,提升了文檔版面分類的準確率。