一種陣列語(yǔ)音增強(qiáng)算法

基本信息

申請(qǐng)?zhí)?/td> CN201811227423.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109308904A 公開(kāi)(公告)日 2019-02-05
申請(qǐng)公布號(hào) CN109308904A 申請(qǐng)公布日 2019-02-05
分類號(hào) G10L21/02;G10L15/22;G10L21/0216;G10L21/0224;G10L21/0232 分類 樂(lè)器;聲學(xué);
發(fā)明人 蔡洪濱;何昕;陳學(xué)超;顧樑 申請(qǐng)(專利權(quán))人 上海聲瀚信息科技有限公司
代理機(jī)構(gòu) 上海海貝律師事務(wù)所 代理人 上海聲瀚信息科技有限公司
地址 200433 上海市楊浦區(qū)國(guó)定路323號(hào)1102-72室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種陣列語(yǔ)音增強(qiáng)算法,包括額步驟有S10噪聲估計(jì):通過(guò)定義接收到的音頻信號(hào),利用對(duì)每個(gè)頻帶跟蹤帶噪語(yǔ)音功率的最小值來(lái)實(shí)現(xiàn)對(duì)該頻帶的噪聲的粗略估計(jì);S20時(shí)頻掩蔽估計(jì):通過(guò)定義某個(gè)時(shí)頻點(diǎn)上語(yǔ)音出現(xiàn)的后驗(yàn)概率為當(dāng)前時(shí)頻點(diǎn)的掩蔽系數(shù),用于估計(jì)噪聲和語(yǔ)音在語(yǔ)譜圖上存在的概率;S30陣列MVDR權(quán)系數(shù)向量估計(jì):通過(guò)定義多路輸入信號(hào)每幀的頻域向量,用于估計(jì)目標(biāo)聲源的具體方位,本發(fā)明在最小畸變的條件下最大程度的提升有效語(yǔ)音,使經(jīng)多路增強(qiáng)后的語(yǔ)音信號(hào)識(shí)別率得到明顯提升,增強(qiáng)語(yǔ)音信號(hào)的信噪比,大大增強(qiáng)了語(yǔ)音的可懂度。