一種語音處理方法、裝置、電子設備和計算機存儲介質

基本信息

申請?zhí)?/td> CN202110546236.5 申請日 -
公開(公告)號 CN113393854A 公開(公告)日 2021-09-14
申請公布號 CN113393854A 申請公布日 2021-09-14
分類號 G10L21/0208(2013.01)I;G10L21/0216(2013.01)I;G10L21/0224(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學;
發(fā)明人 汪劍;李志飛 申請(專利權)人 出門問問信息科技有限公司
代理機構 北京樂知新創(chuàng)知識產(chǎn)權代理事務所(普通合伙) 代理人 周偉
地址 100044北京市海淀區(qū)高梁橋斜街42號院1號樓-1層-101
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語音處理方法,包括:構建第一語音數(shù)據(jù)和第二語音數(shù)據(jù)的訓練對;將第一語音數(shù)據(jù)和第二語音數(shù)據(jù)的原始特征分別輸入生成模型,生成與第一語音數(shù)據(jù)對應的第一嵌入數(shù)據(jù)、及與第二語音數(shù)據(jù)對應的第二嵌入數(shù)據(jù);將第一嵌入數(shù)據(jù)和第二嵌入數(shù)據(jù)輸入判別模型進行訓練,獲得判別結果;根據(jù)判別模型,用隨機梯度下降的方式進行對抗模型學習,獲得語音降噪模型;根據(jù)語音降噪模型對目標語音數(shù)據(jù)進行降噪處理。本發(fā)明在保證其魯棒性、在對先驗知識依賴比較少的前提下,利用深度學習網(wǎng)絡自適應的去充分學習正常信號和噪音信號之間的關聯(lián)性和差異性,實現(xiàn)較好的語音降噪效果。