一種利用神經(jīng)網(wǎng)絡(luò)的語(yǔ)音活性檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN202110979720.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113421595A 公開(kāi)(公告)日 2021-09-21
申請(qǐng)公布號(hào) CN113421595A 申請(qǐng)公布日 2021-09-21
分類號(hào) G10L25/81(2013.01)I;G10L25/84(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 萬(wàn)東琴;胡岸;劉文通;曾帆 申請(qǐng)(專利權(quán))人 成都啟英泰倫科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 610041四川省成都市高新區(qū)天府五街200號(hào)菁蓉匯4號(hào)樓A座12層
法律狀態(tài) -

摘要

摘要 一種利用神經(jīng)網(wǎng)絡(luò)的語(yǔ)音活性檢測(cè)方法,包括模型訓(xùn)練過(guò)程和語(yǔ)音活性檢測(cè)過(guò)程;所述模型訓(xùn)練過(guò)程包括以下步驟:S1.對(duì)用于訓(xùn)練的純凈語(yǔ)音確定端點(diǎn)檢測(cè)標(biāo)簽;S2.對(duì)純凈語(yǔ)音進(jìn)行隨機(jī)加噪,構(gòu)造訓(xùn)練集;S3.逐幀處理,提取訓(xùn)練集中的多階多分辨率耳蝸圖特征向量;S4.構(gòu)建多層門控制循環(huán)單元網(wǎng)絡(luò),利用訓(xùn)練集對(duì)其進(jìn)行訓(xùn)練,得到多層門控制循環(huán)單元成熟模型,利用成熟模型進(jìn)行語(yǔ)音活性檢測(cè)。本發(fā)明利用神經(jīng)網(wǎng)絡(luò)良好的分類性能,提取帶噪語(yǔ)音的特定特征,并通過(guò)預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,對(duì)語(yǔ)音以及噪聲進(jìn)行初步分類并求得一個(gè)語(yǔ)音存在概率;通過(guò)狀態(tài)機(jī)對(duì)獲得的語(yǔ)音存在概率進(jìn)行后處理,從而得到一個(gè)平滑且相對(duì)準(zhǔn)確的語(yǔ)音活性檢測(cè)標(biāo)識(shí)。