一種多模態(tài)和多尺度融合的候選區(qū)域生成方法及相關(guān)裝置

基本信息

申請(qǐng)?zhí)?/td> CN202111655197.9 申請(qǐng)日 -
公開(公告)號(hào) CN114372944A 公開(公告)日 2022-04-19
申請(qǐng)公布號(hào) CN114372944A 申請(qǐng)公布日 2022-04-19
分類號(hào) G06T5/50(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳瑞鋒;鄒文斌;田時(shí)舜;李霞 申請(qǐng)(專利權(quán))人 慧視創(chuàng)新(深圳)有限公司
代理機(jī)構(gòu) 深圳市恒申知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 代理人 廖厚琪
地址 518000廣東省深圳市南山區(qū)粵海街道南海大道3688號(hào)
法律狀態(tài) -

摘要

摘要 根據(jù)本發(fā)明實(shí)施例公開的多模態(tài)和多尺度融合的候選區(qū)域生成方法及相關(guān)裝置,引入深度圖信息為網(wǎng)絡(luò)帶來豐富的三維幾何結(jié)構(gòu)信息,以此來改善單模態(tài)候選區(qū)域生成算法的局限性。同時(shí),所提出的門機(jī)制引導(dǎo)的多模態(tài)融合模塊考慮了輸入圖像的噪聲和圖像質(zhì)量問題,能夠利用模態(tài)間的互補(bǔ)特征去彌補(bǔ)另一模態(tài)特征中的噪聲,提高各模態(tài)特征的質(zhì)量,并且該模塊能夠在充分聚合有用的多模態(tài)信息同時(shí)減少冗余特征的引入。此外,為了獲取更高質(zhì)量的多尺度特征,利用流引導(dǎo)的多尺度聚合模塊來提高高級(jí)語義信息在網(wǎng)絡(luò)間傳遞的效率,讓每個(gè)多尺度特征都能夠獲取到有用的全局信息,從而生成更準(zhǔn)確的候選區(qū)域框。