文本行語(yǔ)種識(shí)別方法、裝置、電子設(shè)備
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110650294.2 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113468979A | 公開(kāi)(公告)日 | 2021-10-01 |
| 申請(qǐng)公布號(hào) | CN113468979A | 申請(qǐng)公布日 | 2021-10-01 |
| 分類號(hào) | G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 黃荔;劉正珍 | 申請(qǐng)(專利權(quán))人 | 漢王科技股份有限公司 |
| 代理機(jī)構(gòu) | 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 莎日娜 |
| 地址 | 100193北京市海淀區(qū)東北旺西路8號(hào)5號(hào)樓三層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請(qǐng)公開(kāi)了一種文本行語(yǔ)種識(shí)別方法,屬于計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域,有助于提升圖像中文本行語(yǔ)種識(shí)別的準(zhǔn)確度。所述方法包括:通過(guò)預(yù)設(shè)深度學(xué)習(xí)網(wǎng)絡(luò)的特征提取模塊,對(duì)目標(biāo)文本圖像進(jìn)行特征提取和融合處理,得到第一向量表示;通過(guò)該網(wǎng)絡(luò)的第一分類模塊對(duì)第一向量表示進(jìn)行二分類映射,確定目標(biāo)文本圖像的二類別概率預(yù)測(cè)圖;基于二類別概率預(yù)測(cè)圖,通過(guò)該網(wǎng)絡(luò)的注意力模塊對(duì)第一向量表示中對(duì)應(yīng)前景像素點(diǎn)的向量進(jìn)行加權(quán)處理,得到第二向量表示;通過(guò)該網(wǎng)絡(luò)的第二分類模塊對(duì)第二向量表示進(jìn)行多分類映射,確定多類別概率預(yù)測(cè)圖;根據(jù)多類別概率預(yù)測(cè)圖,確定目標(biāo)文本圖像中匹配各預(yù)設(shè)語(yǔ)種的文本行的位置信息,提升了圖像中文本行及語(yǔ)種識(shí)別準(zhǔn)確度。 |





