基于BiLSTM和注意力機制的圖文多模態(tài)情感識別方法

基本信息

申請?zhí)?/td> CN202111021378.6 申請日 -
公開(公告)號 CN113705703A 公開(公告)日 2021-11-26
申請公布號 CN113705703A 申請公布日 2021-11-26
分類號 G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 金勇;胡林利;陳宏明 申請(專利權(quán))人 武漢長江通信產(chǎn)業(yè)集團股份有限公司
代理機構(gòu) 上海精晟知識產(chǎn)權(quán)代理有限公司 代理人 劉點
地址 430000湖北省武漢市東湖開發(fā)區(qū)關(guān)東工業(yè)園文華路2號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于BiLSTM和注意力機制的圖文多模態(tài)情感識別方法,包括如下步驟:采集文本數(shù)據(jù)和圖片數(shù)據(jù);向量預(yù)處理,文本和圖片先單獨進行向量表達;文本向量和圖片向量各自均經(jīng)過注意力機制attention和GRU模型的結(jié)合訓(xùn)練;文本和圖片的向量聯(lián)合起來通過softmax函數(shù)進行最終綜合結(jié)果的識別。本發(fā)明采用WORD2VEC和CNN技術(shù)分別對文本和圖片進行預(yù)處理得到初步向量表達,然后采用BiLSTM、GRU和注意力機制進行交叉訓(xùn)練,再將結(jié)果融合到softmax層進行最終監(jiān)督式標簽識別。實驗針對19000條以上的數(shù)據(jù)(每條數(shù)據(jù)包含文本和圖片)進行模型訓(xùn)練分析,結(jié)果證明融合了圖片和文字的機器學(xué)習(xí)效果更好。