一種文字識別編校方法

基本信息

申請?zhí)?/td> CN201810493009.9 申請日 -
公開(公告)號 CN108710855A 公開(公告)日 2018-10-26
申請公布號 CN108710855A 申請公布日 2018-10-26
分類號 G06K9/00;G06K9/32;G06K9/54;G06F17/27 分類 計算;推算;計數;
發(fā)明人 員戰(zhàn)強;王長征;胡志強;師峰;劉文曉;梁詢 申請(專利權)人 山西同方知網數字出版技術有限公司
代理機構 北京天奇智新知識產權代理有限公司 代理人 山西同方知網數字出版技術有限公司
地址 030006 山西省太原市高新區(qū)產業(yè)路48號新島科技園D座
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文字識別編校方法,包括:對文檔圖片進行圖像預處理;對圖像預處理后的文檔圖片通過多路識別引擎對文檔中的文字進行識別,得到文字識別結果;對識別的文字結果進行歸一化處理;自動糾正識別的文字內容;對識別存疑的內容進行人工編校。本發(fā)明對以文字為主體的文檔的識別系統(tǒng)錯誤率控制在0.005%?0.3%,并且,在人工編校工作中,可將需要人工編校的文字量控制在3%?5%。