一種基于深度學習的語音情緒識別方案
基本信息

| 申請?zhí)?/td> | CN202010089880.X | 申請日 | - |
| 公開(公告)號 | CN111292724A | 公開(公告)日 | 2020-06-16 |
| 申請公布號 | CN111292724A | 申請公布日 | 2020-06-16 |
| 分類號 | G10L15/06(2013.01)I | 分類 | - |
| 發(fā)明人 | 封吉寧 | 申請(專利權(quán))人 | 上海凱岸信息科技有限公司 |
| 代理機構(gòu) | 上海海貝律師事務所 | 代理人 | 上海凱岸信息科技有限公司 |
| 地址 | 201808上海市嘉定區(qū)嘉羅公路1661弄12號101室-16 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于深度學習的語音情緒識別方案,包括如下步驟:步驟一,將訓練用語音音頻文件進行傅里葉變換轉(zhuǎn)換到頻域,然后再利用梅爾頻率刻度的濾波器組對對應頻域信號進行處理得到,就可以得到梅爾譜圖,步驟二,語音情緒分類模型進行建立:將步驟一中的梅爾譜圖經(jīng)過CNN和LSTM的計算后,自動生成對于語音情緒分類重要的組合特征變量。本發(fā)明,第一點是使用深度學習方法替代傳統(tǒng)機器學習方法,省去了耗時耗力的手工進行特征工程的步驟,使得整個模型訓練過程更加清晰簡潔。?? |





