基于多媒體語義解析的監(jiān)控視頻智能預(yù)警方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110447507.1 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN113111837A | 公開(公告)日 | 2021-07-13 |
| 申請(qǐng)公布號(hào) | CN113111837A | 申請(qǐng)公布日 | 2021-07-13 |
| 分類號(hào) | G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 胡宇鵬;賈永坡;高贊;宋雪萌;尹建華;李毅仁;聶禮強(qiáng) | 申請(qǐng)(專利權(quán))人 | 河鋼集團(tuán)有限公司 |
| 代理機(jī)構(gòu) | 濟(jì)南泉城專利商標(biāo)事務(wù)所 | 代理人 | 支文彬 |
| 地址 | 250013山東省濟(jì)南市歷下區(qū)科院路19號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種基于多媒體語義解析的監(jiān)控視頻智能預(yù)警方法,通過建立跨模態(tài)語義對(duì)齊模型對(duì)視頻中所包含的復(fù)雜對(duì)象與交互進(jìn)行準(zhǔn)確理解,并生成視頻片段時(shí)空位置圖和視頻語義樹,另一方面,引入基于雙向長短時(shí)記憶網(wǎng)絡(luò)的文本編碼模塊,對(duì)查詢語句中的文本語義進(jìn)行深刻理解與表征。實(shí)現(xiàn)多模態(tài)特征向共空間的特征映射與融合,并利用語義剪枝策略,粗粒度篩選出精煉的“視頻片段?查詢語句”對(duì),進(jìn)行細(xì)粒度語義匹配計(jì)算,從而確??缒B(tài)視頻定位的精度與效率。 |





