大分辨率圖像的目標(biāo)檢測和識別方法及裝置

基本信息

申請?zhí)?/td> CN202210255384.6 申請日 -
公開(公告)號 CN114332456A 公開(公告)日 2022-04-12
申請公布號 CN114332456A 申請公布日 2022-04-12
分類號 G06V10/25(2022.01)I;G06V10/26(2022.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張凱;馬樂樂;崔超然;逯天斌 申請(專利權(quán))人 山東力聚機(jī)器人科技股份有限公司
代理機(jī)構(gòu) 北京中和立達(dá)知識產(chǎn)權(quán)代理有限公司 代理人 孟姣
地址 276808山東省日照市嵐山區(qū)安東衛(wèi)街道玉泉二路99號(嵐山區(qū)科技孵化器電商創(chuàng)業(yè)園)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,是關(guān)于一種大分辨率圖像的目標(biāo)檢測和識別方法及裝置,方法包括:獲取大分辨率圖像集,進(jìn)行數(shù)據(jù)增強(qiáng),得到增強(qiáng)后的圖像集;對增強(qiáng)后的圖像集中的每個(gè)原始圖像進(jìn)行分割,得到對應(yīng)的子圖像及其位置信息;對子圖像及其位置信息進(jìn)行編碼和融合處理,以得到對應(yīng)的數(shù)據(jù)張量;基于Faster R?CNN模型,對數(shù)據(jù)張量進(jìn)行逐層特征表示學(xué)習(xí),采用注意力機(jī)制對Faster R?CNN模型的低層信息、中層信息和高層信息進(jìn)行融合,確定子圖像對應(yīng)的特征表示,進(jìn)而確定候選目標(biāo)位置,進(jìn)行回歸和分類,以確定最終目標(biāo)位置及其所屬的類別;根據(jù)最終目標(biāo)位置及其所屬的類別確定原始圖像的最終目標(biāo)位置及其所屬的類別。通過該方案,提升了最終的模型性能。