文本識別方法、裝置、設備和計算機可讀介質(zhì)

基本信息

申請?zhí)?/td> CN201910689053.1 申請日 -
公開(公告)號 CN112307820B 公開(公告)日 2022-03-22
申請公布號 CN112307820B 申請公布日 2022-03-22
分類號 G06V30/19(2022.01)I;G06K9/62(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 潘能超 申請(專利權)人 北京易真學思教育科技有限公司
代理機構(gòu) 北京合智同創(chuàng)知識產(chǎn)權代理有限公司 代理人 李杰
地址 100041北京市石景山區(qū)實興大街30號院3號樓2層A-2667房間
法律狀態(tài) -

摘要

摘要 本申請實施例提供了一種文本識別方法、裝置、設備和計算機可讀介質(zhì)。該方法包括:通過預先訓練好的第一文本識別模型對待識別文本進行處理得到第一概率矩陣;根據(jù)第一概率矩陣確定第一識別結(jié)果;確定第一識別結(jié)果中中文字符的占比以及是否存在特殊字符;若中文字符的占比不小于預設閾值或存在特殊字符,將第一識別結(jié)果作為最終識別結(jié)果;若中文字符的占比小于預設閾值且不存在特殊字符,通過預先訓練好的第二文本識別模型對待識別文本進行處理得到第二概率矩陣,根據(jù)第一概率矩陣和第二概率矩陣確定最終識別結(jié)果。通過對得到的概率矩陣進行處理以得到最終識別結(jié)果,提高對待識別文本的識別精度,實現(xiàn)對不同類別數(shù)據(jù)識別時具有良好的識別效果。