自然場景文字識別方法及裝置

基本信息

申請?zhí)?/td> CN201811272122.0 申請日 -
公開(公告)號 CN109522900B 公開(公告)日 2020-12-18
申請公布號 CN109522900B 申請公布日 2020-12-18
分類號 G06K9/34;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 鞠海玲;張默 申請(專利權(quán))人 北京陌上花科技有限公司
代理機構(gòu) 北京卓唐知識產(chǎn)權(quán)代理有限公司 代理人 北京陌上花科技有限公司
地址 100080 北京市海淀區(qū)丹棱街6號中關(guān)村金融大廈SOHO3Q
法律狀態(tài) -

摘要

摘要 本申請公開了一種自然場景文字識別方法及裝置。該方法包括:將獲取的自然場景圖輸入實例分割網(wǎng)絡(luò)得到掩碼圖和像素圖;根據(jù)所述掩碼圖確定空間變換網(wǎng)絡(luò)的控制參數(shù);通過設(shè)置所述控制參數(shù)的空間變換網(wǎng)絡(luò)將所述像素圖變換成糾形圖;以及,采用文字識別網(wǎng)絡(luò)識別出所述糾形圖中的文字序列。該裝置包括:輸入單元、確定單元、變換單元及識別單元。本申請解決了由于自然場景圖中文字以外的信息會干擾變換效果造成的文字序列識別準(zhǔn)確率低的技術(shù)問題。