一種基于神經(jīng)網(wǎng)絡(luò)的立體聲回聲消除方法及系統(tǒng)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202010389995.0 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN111292759A | 公開(公告)日 | 2020-06-16 |
| 申請(qǐng)公布號(hào) | CN111292759A | 申請(qǐng)公布日 | 2020-06-16 |
| 分類號(hào) | G10L21/0208(2013.01)I | 分類 | - |
| 發(fā)明人 | 馬崇澤;王照鋼;徐棟麟 | 申請(qǐng)(專利權(quán))人 | 上海亮牛半導(dǎo)體科技有限公司 |
| 代理機(jī)構(gòu) | 上海元好知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 上海亮牛半導(dǎo)體科技有限公司 |
| 地址 | 201203上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)芳春路400號(hào)1幢3層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開一種基于神經(jīng)網(wǎng)絡(luò)的立體聲回聲消除方法及系統(tǒng),系統(tǒng)輸入三路音頻信號(hào),分別為麥克風(fēng)信號(hào)、立體聲揚(yáng)聲器播放的左聲道參考信號(hào)和右聲道參考信號(hào);三路音頻信號(hào)經(jīng)短時(shí)傅里葉變換得到三路頻域信號(hào),壓縮形成頻段能量信息,三路頻段能量信息作為神經(jīng)網(wǎng)絡(luò)模型的輸入,通過訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型輸出理想概率掩蔽IRM值;神經(jīng)網(wǎng)絡(luò)模型以設(shè)定的IRM值作為訓(xùn)練的目標(biāo);根據(jù)計(jì)算得到的IRM值及麥克風(fēng)信號(hào)對(duì)應(yīng)的頻段信息能量值得到回聲消除后的頻域信息;頻域信息經(jīng)逆短時(shí)傅里葉變換得到時(shí)域信息,完成回聲消除。本發(fā)明采用人工智能?深度學(xué)習(xí)的方法取代傳統(tǒng)復(fù)雜的立體聲回聲消除算法,實(shí)現(xiàn)語(yǔ)音通信中立體聲的回聲消除。?? |





