一種基于深度學(xué)習(xí)的狗叫情感識(shí)別方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201610709581.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106340309B 公開(kāi)(公告)日 2019-11-12
申請(qǐng)公布號(hào) CN106340309B 申請(qǐng)公布日 2019-11-12
分類(lèi)號(hào) G10L25/63(2013.01)I; G10L25/30(2013.01)I; G10L25/24(2013.01)I; G10L17/26(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 居一; 劉美麗; 劉家銘 申請(qǐng)(專(zhuān)利權(quán))人 上海索洛信息技術(shù)有限公司
代理機(jī)構(gòu) 北京盛凡智榮知識(shí)產(chǎn)權(quán)代理有限公司 代理人 上海索洛信息技術(shù)有限公司
地址 201100 上海市閔行區(qū)紫星路588號(hào)2幢13層023室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的狗叫情感識(shí)別方法,包括:基于狗的叫聲設(shè)計(jì)叫聲存儲(chǔ)層、端點(diǎn)檢測(cè)層、帶注意力模塊的前饋深度神經(jīng)網(wǎng)絡(luò)模型、卷積神經(jīng)網(wǎng)絡(luò)模型、線(xiàn)性集成模型;叫聲信號(hào)經(jīng)存儲(chǔ)、端點(diǎn)檢測(cè)后計(jì)算MFCC特征,訓(xùn)練帶注意力模塊的前饋深度神經(jīng)網(wǎng)絡(luò)模型,判斷狗叫聲和非狗叫聲;計(jì)算狗叫信號(hào)的MFCC特征和Mel Filterbank特征,交叉輸入訓(xùn)練帶注意力模塊的前饋深度神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)模型,將產(chǎn)生的四個(gè)模型線(xiàn)性集成,識(shí)別狗叫的十種情感,并將結(jié)果可視化。此外,本發(fā)明還提供了一種基于深度學(xué)習(xí)的狗叫情感識(shí)別轉(zhuǎn)裝置,本裝置可以實(shí)時(shí)監(jiān)測(cè)狗叫的感情變化,且能夠遠(yuǎn)程顯示其感情狀態(tài)。