一種基于全局上下文信息探索的RGB-D顯著性目標檢測方法

基本信息

申請?zhí)?/td> CN202210300694.5 申請日 -
公開(公告)號 CN114693951A 公開(公告)日 2022-07-01
申請公布號 CN114693951A 申請公布日 2022-07-01
分類號 G06V10/46(2022.01)I;G06V10/80(2022.01)I;G06V10/774(2022.01)I;G06K9/62(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 黃榮梅;廖濤;段松松 申請(專利權(quán))人 安徽理工大學
代理機構(gòu) - 代理人 -
地址 232001安徽省淮南市山南新區(qū)泰豐大街168號
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于計算機視覺領(lǐng)域,公開了一種基于全局上下文信息探索的RGB?D顯著性目標檢測方法,包括以下步驟:1)獲取訓練和測試該任務(wù)的RGB?D數(shù)據(jù)集,并定義本發(fā)明的算法目標,并確定用于訓練和測試算法的訓練集和測試集;2)基于連續(xù)卷積層堆疊用來構(gòu)建跨模態(tài)上下文特征模塊提取特征信息;3)定義一疊連續(xù)的卷積層和多尺度特征的多尺度特征解碼器(MFD)以及空間通道注意力;4)構(gòu)建多尺度特征解碼器,將這些多尺度特征融合到一個自上而下的聚合策略中,并生成顯著性結(jié)果;5)采用二元交叉熵(BCE)來訓練本發(fā)明的模型,這也是SOD任務(wù)中普遍存在的損失函數(shù)。計算出在不同的像素下的預測值和真實值之間的誤差。