文檔結構化方法、系統(tǒng)、終端及介質

基本信息

申請?zhí)?/td> CN202011441141.9 申請日 -
公開(公告)號 CN112597773A 公開(公告)日 2021-04-02
申請公布號 CN112597773A 申請公布日 2021-04-02
分類號 G06F40/295(2020.01)I;G06F40/151(2020.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 周異;周曲;韋建;何建華 申請(專利權)人 上海深杳智能科技有限公司
代理機構 上海恒慧知識產權代理事務所(特殊普通合伙) 代理人 劉翠
地址 200240上海市閔行區(qū)零號灣科技1號樓1109室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種文檔結構化方法及系統(tǒng),包括:獲取文檔的文字區(qū)塊以及文字字段;其中,所述文字區(qū)塊包括位置框,所述文字字段包括位置框和文本內容;基于所述文字區(qū)塊的位置框和文字字段的位置框,對所述文本內容進行排列;基于所述文本內容的排列結果,進行結構化信息提?。桓鶕?jù)提取的結構化信息,建立結構化文檔。同時提供了一種對應的終端及存儲介質。本發(fā)明能夠突破基于圖像目標檢測必須使用固定文檔模板的局限性,并提高文字檢測識別方法的準確性。??