一種基于注意力機制的深度監(jiān)督跨模態(tài)對抗學習方法

基本信息

申請?zhí)?/td> CN202110144443.8 申請日 -
公開(公告)號 CN112905822B 公開(公告)日 2022-07-01
申請公布號 CN112905822B 申請公布日 2022-07-01
分類號 G06F16/55(2019.01)I;G06F16/583(2019.01)I;G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數;
發(fā)明人 曾煥強;王欣唯;朱建清;廖昀;劉青松;陳虢 申請(專利權)人 廈門云知芯智能科技有限公司
代理機構 廈門市首創(chuàng)君合專利事務所有限公司 代理人 -
地址 362000福建省泉州市豐澤區(qū)城東城華北路269號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于注意力機制的深度監(jiān)督跨模態(tài)對抗學習方法,針對每個模態(tài)構建深度學習網絡獲取深度特征,引入生成對抗網絡,利用模態(tài)間的交叉判別借助注意力機制不斷提煉模態(tài)特征網絡的生成特征,在公共子空間進行異質性數據的度量的同時,利用標簽信息在標簽空間對模態(tài)數據進行深度監(jiān)督學習。如此構建的網絡,使得訓練得到的基于注意力機制的跨模態(tài)深度監(jiān)督對抗模型具有良好的圖文互相檢索性能;在檢索過程中利用訓練得到的網絡模型M對待查詢圖像(文本)和候選庫中的文本(圖像)進行特征提取以及余弦距離計算,從而獲取待查詢圖像(文本)與候選庫中的文本(圖像)數據之間的相似度較高者,實現跨模態(tài)檢索。