一種基于深度學習的語音情緒識別方案

基本信息

申請?zhí)?/td> CN202010089880.X 申請日 -
公開(公告)號 CN111292724A 公開(公告)日 2020-06-16
申請公布號 CN111292724A 申請公布日 2020-06-16
分類號 G10L15/06(2013.01)I 分類 -
發(fā)明人 封吉寧 申請(專利權(quán))人 上海凱岸信息科技有限公司
代理機構(gòu) 上海海貝律師事務所 代理人 上海凱岸信息科技有限公司
地址 201808上海市嘉定區(qū)嘉羅公路1661弄12號101室-16
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學習的語音情緒識別方案,包括如下步驟:步驟一,將訓練用語音音頻文件進行傅里葉變換轉(zhuǎn)換到頻域,然后再利用梅爾頻率刻度的濾波器組對對應頻域信號進行處理得到,就可以得到梅爾譜圖,步驟二,語音情緒分類模型進行建立:將步驟一中的梅爾譜圖經(jīng)過CNN和LSTM的計算后,自動生成對于語音情緒分類重要的組合特征變量。本發(fā)明,第一點是使用深度學習方法替代傳統(tǒng)機器學習方法,省去了耗時耗力的手工進行特征工程的步驟,使得整個模型訓練過程更加清晰簡潔。??