一種基于文字表述的行人檢索方法
基本信息

| 申請?zhí)?/td> | CN202110311957.8 | 申請日 | - |
| 公開(公告)號 | CN113157974A | 公開(公告)日 | 2021-07-23 |
| 申請公布號 | CN113157974A | 申請公布日 | 2021-07-23 |
| 分類號 | G06F16/75;G06F16/783;G06K9/00;G06K9/62;G06N3/04;G06N3/08 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 朱繼;楊少毅;褚智威;石光明;李甫;牛毅 | 申請(專利權(quán))人 | 西安維塑智能科技有限公司 |
| 代理機(jī)構(gòu) | 西安智萃知識產(chǎn)權(quán)代理有限公司 | 代理人 | 王暢陽 |
| 地址 | 710018 陜西省西安市鳳城十路99號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提出一種基于文字表述的行人檢索方法,包括步驟1:在全局神經(jīng)網(wǎng)絡(luò)分支中,提取圖像和文字的全局特征;步驟2:在細(xì)粒度神經(jīng)網(wǎng)絡(luò)分支中,通過引入關(guān)注度機(jī)制的神經(jīng)網(wǎng)絡(luò),提取圖像和文字相互對應(yīng)的細(xì)粒度特征;步驟3:在粗粒度神經(jīng)網(wǎng)絡(luò)分支中,將步驟2中提取的細(xì)粒度圖像和文字特征分別輸入到圖卷積神經(jīng)網(wǎng)絡(luò)中,將人體結(jié)構(gòu)的先驗信息嵌入到所提取的特征中;步驟4:分別計算步驟1?3所述三個神經(jīng)網(wǎng)絡(luò)分支相對應(yīng)的圖像和文字特征的余弦相似度并求和,作為圖像和文字的最終相似度;步驟5:比較文字表述和行人圖像庫中每張行人圖像的余弦相似度,選取相似度最高的行人圖像作為行人檢索的匹配結(jié)果;本方法提高了行人檢索的準(zhǔn)確率和魯棒性。 |





