大分辨率圖像的目標(biāo)檢測和識別方法及裝置
基本信息

| 申請?zhí)?/td> | CN202210255384.6 | 申請日 | - |
| 公開(公告)號 | CN114332456A | 公開(公告)日 | 2022-04-12 |
| 申請公布號 | CN114332456A | 申請公布日 | 2022-04-12 |
| 分類號 | G06V10/25(2022.01)I;G06V10/26(2022.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 張凱;馬樂樂;崔超然;逯天斌 | 申請(專利權(quán))人 | 山東力聚機(jī)器人科技股份有限公司 |
| 代理機(jī)構(gòu) | 北京中和立達(dá)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 孟姣 |
| 地址 | 276808山東省日照市嵐山區(qū)安東衛(wèi)街道玉泉二路99號(嵐山區(qū)科技孵化器電商創(chuàng)業(yè)園) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,是關(guān)于一種大分辨率圖像的目標(biāo)檢測和識別方法及裝置,方法包括:獲取大分辨率圖像集,進(jìn)行數(shù)據(jù)增強(qiáng),得到增強(qiáng)后的圖像集;對增強(qiáng)后的圖像集中的每個(gè)原始圖像進(jìn)行分割,得到對應(yīng)的子圖像及其位置信息;對子圖像及其位置信息進(jìn)行編碼和融合處理,以得到對應(yīng)的數(shù)據(jù)張量;基于Faster R?CNN模型,對數(shù)據(jù)張量進(jìn)行逐層特征表示學(xué)習(xí),采用注意力機(jī)制對Faster R?CNN模型的低層信息、中層信息和高層信息進(jìn)行融合,確定子圖像對應(yīng)的特征表示,進(jìn)而確定候選目標(biāo)位置,進(jìn)行回歸和分類,以確定最終目標(biāo)位置及其所屬的類別;根據(jù)最終目標(biāo)位置及其所屬的類別確定原始圖像的最終目標(biāo)位置及其所屬的類別。通過該方案,提升了最終的模型性能。 |





