文本行語(yǔ)種識(shí)別方法、裝置、電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110650294.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113468979A 公開(kāi)(公告)日 2021-10-01
申請(qǐng)公布號(hào) CN113468979A 申請(qǐng)公布日 2021-10-01
分類號(hào) G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃荔;劉正珍 申請(qǐng)(專利權(quán))人 漢王科技股份有限公司
代理機(jī)構(gòu) 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 代理人 莎日娜
地址 100193北京市海淀區(qū)東北旺西路8號(hào)5號(hào)樓三層
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種文本行語(yǔ)種識(shí)別方法,屬于計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,有助于提升圖像中文本行語(yǔ)種識(shí)別的準(zhǔn)確度。所述方法包括:通過(guò)預(yù)設(shè)深度學(xué)習(xí)網(wǎng)絡(luò)的特征提取模塊,對(duì)目標(biāo)文本圖像進(jìn)行特征提取和融合處理,得到第一向量表示;通過(guò)該網(wǎng)絡(luò)的第一分類模塊對(duì)第一向量表示進(jìn)行二分類映射,確定目標(biāo)文本圖像的二類別概率預(yù)測(cè)圖;基于二類別概率預(yù)測(cè)圖,通過(guò)該網(wǎng)絡(luò)的注意力模塊對(duì)第一向量表示中對(duì)應(yīng)前景像素點(diǎn)的向量進(jìn)行加權(quán)處理,得到第二向量表示;通過(guò)該網(wǎng)絡(luò)的第二分類模塊對(duì)第二向量表示進(jìn)行多分類映射,確定多類別概率預(yù)測(cè)圖;根據(jù)多類別概率預(yù)測(cè)圖,確定目標(biāo)文本圖像中匹配各預(yù)設(shè)語(yǔ)種的文本行的位置信息,提升了圖像中文本行及語(yǔ)種識(shí)別準(zhǔn)確度。