一種基于深度學(xué)習(xí)的空中管制語(yǔ)音降噪方法

基本信息

申請(qǐng)?zhí)?/td> CN202110413991.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113129919A 公開(kāi)(公告)日 2021-07-16
申請(qǐng)公布號(hào) CN113129919A 申請(qǐng)公布日 2021-07-16
分類(lèi)號(hào) G10L21/0208(2013.01)I;G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 顧毅陶;李鑫;王宏鋒 申請(qǐng)(專(zhuān)利權(quán))人 上海麥圖信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 200000上海市徐匯區(qū)桂平路680號(hào)32幢527-1室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的空中管制語(yǔ)音降噪方法,步驟如下:獲取待降噪音頻,將其轉(zhuǎn)換為16bit/16kHz的PCM音頻數(shù)據(jù),并通過(guò)短時(shí)傅里葉變換由時(shí)域轉(zhuǎn)換為頻域;建立深度網(wǎng)絡(luò)模型;建立空管音頻訓(xùn)練數(shù)據(jù)集和標(biāo)簽數(shù)據(jù)集;利用訓(xùn)練數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò)模型得到降噪模型;待降噪音頻經(jīng)短時(shí)傅里葉變換后輸入到降噪模型,并與短時(shí)傅里葉變換分離得到的相位信息進(jìn)行點(diǎn)積操作,然后通過(guò)逆短時(shí)傅里葉變換生成降噪音頻。本發(fā)明深度網(wǎng)絡(luò)模型使用帶有長(zhǎng)連接的Encoder?Decoder模型來(lái)進(jìn)行特征提取,并且通過(guò)1X1卷積核對(duì)提取的特征數(shù)據(jù)進(jìn)行處理,生成降噪語(yǔ)音。本發(fā)明具有極強(qiáng)的降噪能力和泛化能力,降噪后的音頻能保留較高的信噪比。