一種基于注意力機制的深度監(jiān)督跨模態(tài)對抗學習方法
基本信息

| 申請?zhí)?/td> | CN202110144443.8 | 申請日 | - |
| 公開(公告)號 | CN112905822B | 公開(公告)日 | 2022-07-01 |
| 申請公布號 | CN112905822B | 申請公布日 | 2022-07-01 |
| 分類號 | G06F16/55(2019.01)I;G06F16/583(2019.01)I;G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數; |
| 發(fā)明人 | 曾煥強;王欣唯;朱建清;廖昀;劉青松;陳虢 | 申請(專利權)人 | 廈門云知芯智能科技有限公司 |
| 代理機構 | 廈門市首創(chuàng)君合專利事務所有限公司 | 代理人 | - |
| 地址 | 362000福建省泉州市豐澤區(qū)城東城華北路269號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種基于注意力機制的深度監(jiān)督跨模態(tài)對抗學習方法,針對每個模態(tài)構建深度學習網絡獲取深度特征,引入生成對抗網絡,利用模態(tài)間的交叉判別借助注意力機制不斷提煉模態(tài)特征網絡的生成特征,在公共子空間進行異質性數據的度量的同時,利用標簽信息在標簽空間對模態(tài)數據進行深度監(jiān)督學習。如此構建的網絡,使得訓練得到的基于注意力機制的跨模態(tài)深度監(jiān)督對抗模型具有良好的圖文互相檢索性能;在檢索過程中利用訓練得到的網絡模型M對待查詢圖像(文本)和候選庫中的文本(圖像)進行特征提取以及余弦距離計算,從而獲取待查詢圖像(文本)與候選庫中的文本(圖像)數據之間的相似度較高者,實現跨模態(tài)檢索。 |





