基于多媒體語義解析的監(jiān)控視頻智能預(yù)警方法

基本信息

申請(qǐng)?zhí)?/td> CN202110447507.1 申請(qǐng)日 -
公開(公告)號(hào) CN113111837A 公開(公告)日 2021-07-13
申請(qǐng)公布號(hào) CN113111837A 申請(qǐng)公布日 2021-07-13
分類號(hào) G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 胡宇鵬;賈永坡;高贊;宋雪萌;尹建華;李毅仁;聶禮強(qiáng) 申請(qǐng)(專利權(quán))人 河鋼集團(tuán)有限公司
代理機(jī)構(gòu) 濟(jì)南泉城專利商標(biāo)事務(wù)所 代理人 支文彬
地址 250013山東省濟(jì)南市歷下區(qū)科院路19號(hào)
法律狀態(tài) -

摘要

摘要 一種基于多媒體語義解析的監(jiān)控視頻智能預(yù)警方法,通過建立跨模態(tài)語義對(duì)齊模型對(duì)視頻中所包含的復(fù)雜對(duì)象與交互進(jìn)行準(zhǔn)確理解,并生成視頻片段時(shí)空位置圖和視頻語義樹,另一方面,引入基于雙向長短時(shí)記憶網(wǎng)絡(luò)的文本編碼模塊,對(duì)查詢語句中的文本語義進(jìn)行深刻理解與表征。實(shí)現(xiàn)多模態(tài)特征向共空間的特征映射與融合,并利用語義剪枝策略,粗粒度篩選出精煉的“視頻片段?查詢語句”對(duì),進(jìn)行細(xì)粒度語義匹配計(jì)算,從而確??缒B(tài)視頻定位的精度與效率。