一種基于深度學(xué)習(xí)的空中管制語(yǔ)音降噪方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110413991.6 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113129919A | 公開(kāi)(公告)日 | 2021-07-16 |
| 申請(qǐng)公布號(hào) | CN113129919A | 申請(qǐng)公布日 | 2021-07-16 |
| 分類(lèi)號(hào) | G10L21/0208(2013.01)I;G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I | 分類(lèi) | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 顧毅陶;李鑫;王宏鋒 | 申請(qǐng)(專(zhuān)利權(quán))人 | 上海麥圖信息科技有限公司 |
| 代理機(jī)構(gòu) | - | 代理人 | - |
| 地址 | 200000上海市徐匯區(qū)桂平路680號(hào)32幢527-1室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的空中管制語(yǔ)音降噪方法,步驟如下:獲取待降噪音頻,將其轉(zhuǎn)換為16bit/16kHz的PCM音頻數(shù)據(jù),并通過(guò)短時(shí)傅里葉變換由時(shí)域轉(zhuǎn)換為頻域;建立深度網(wǎng)絡(luò)模型;建立空管音頻訓(xùn)練數(shù)據(jù)集和標(biāo)簽數(shù)據(jù)集;利用訓(xùn)練數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò)模型得到降噪模型;待降噪音頻經(jīng)短時(shí)傅里葉變換后輸入到降噪模型,并與短時(shí)傅里葉變換分離得到的相位信息進(jìn)行點(diǎn)積操作,然后通過(guò)逆短時(shí)傅里葉變換生成降噪音頻。本發(fā)明深度網(wǎng)絡(luò)模型使用帶有長(zhǎng)連接的Encoder?Decoder模型來(lái)進(jìn)行特征提取,并且通過(guò)1X1卷積核對(duì)提取的特征數(shù)據(jù)進(jìn)行處理,生成降噪語(yǔ)音。本發(fā)明具有極強(qiáng)的降噪能力和泛化能力,降噪后的音頻能保留較高的信噪比。 |





