一種視覺顯著性預(yù)測方法及設(shè)備

基本信息

申請?zhí)?/td> CN202010789004.8 申請日 -
公開(公告)號 CN112040222A 公開(公告)日 2020-12-04
申請公布號 CN112040222A 申請公布日 2020-12-04
分類號 H04N17/00;G06T7/00 分類 電通信技術(shù);
發(fā)明人 廖建鑫;鄒文斌;莊越;卓圣楷;鄒輝;李霞;袁濤 申請(專利權(quán))人 深圳市慧視智聯(lián)科技有限公司
代理機構(gòu) 深圳市君勝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳大學(xué);深圳市慧視智聯(lián)科技有限公司
地址 518060 廣東省深圳市南山區(qū)南海大道3688號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種視覺顯著性預(yù)測方法及設(shè)備,通過獲取待檢測視頻;所述待檢測視頻含有多個視頻幀,且多個所述視頻幀中均含有目標(biāo)注視物;將待檢測視頻輸入已訓(xùn)練的顯著性預(yù)測模型,得到與所述待檢測視頻相對應(yīng)的顯著性圖;其中,顯著性預(yù)測模型包括編碼端和解碼端;所述編碼端包括多個用于分配各個視頻幀所占權(quán)重的幀間注意力模塊,所述解碼端包括多個用于對輸入的空間特征上采樣和對輸入的時間特征降維的自適應(yīng)上采樣模塊。本實施例中由于在顯著性預(yù)測模型的編碼端加入幀間注意力模塊,以增加幀間傳遞的時間特征信息,以及在解碼端加入自適應(yīng)上采樣模塊,以優(yōu)化空間特征,提高了人眼注視點預(yù)測的精確性和人眼注視點轉(zhuǎn)移捕捉的魯棒性。