一種違規(guī)圖像識別方法、系統(tǒng)及設備

基本信息

申請?zhí)?/td> CN202210115379.5 申請日 -
公開(公告)號 CN114140673A 公開(公告)日 2022-03-04
申請公布號 CN114140673A 申請公布日 2022-03-04
分類號 G06V10/80(2022.01)I;G06V30/148(2022.01)I;G06V10/774(2022.01)I;G06V10/764(2022.01)I;G06F40/289(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 阮曉峰;王堅;李兵;余昊楠;胡衛(wèi)明 申請(專利權)人 人民中科(北京)智能技術有限公司
代理機構 北京三友知識產(chǎn)權代理有限公司 代理人 許曼;劉飛
地址 250101山東省濟南市中國(山東)自由貿(mào)易試驗區(qū)濟南片區(qū)經(jīng)十路7000號漢峪金谷新媒體大廈2層201室
法律狀態(tài) -

摘要

摘要 本文涉及人工智能領域,提供了一種違規(guī)圖像識別方法、系統(tǒng)及設備,方法包括:分析待識別圖像,得到文本信息及圖像信息;將文本信息輸入至文本特征提取模型中,得到文本特征向量組;將圖像信息輸入至圖像特征提取模型中,得到圖像特征向量組;將文本特征向量組及圖像特征向量組輸入至特征融合模型中,得到融合特征向量組,特征融合模型用于利用交叉注意力機制使得文本特征向量為圖像特征向量添加注意力;將融合特征向量組輸入至分類識別模型中,得到違規(guī)識別結果。本文使用交叉注意力機制融合兩種模態(tài)特征,可提升違規(guī)圖像識別的性能及魯棒性。