一種利用神經(jīng)網(wǎng)絡(luò)的語(yǔ)音活性檢測(cè)方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110979720.7 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113421595A | 公開(kāi)(公告)日 | 2021-09-21 |
| 申請(qǐng)公布號(hào) | CN113421595A | 申請(qǐng)公布日 | 2021-09-21 |
| 分類號(hào) | G10L25/81(2013.01)I;G10L25/84(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 萬(wàn)東琴;胡岸;劉文通;曾帆 | 申請(qǐng)(專利權(quán))人 | 成都啟英泰倫科技有限公司 |
| 代理機(jī)構(gòu) | - | 代理人 | - |
| 地址 | 610041四川省成都市高新區(qū)天府五街200號(hào)菁蓉匯4號(hào)樓A座12層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種利用神經(jīng)網(wǎng)絡(luò)的語(yǔ)音活性檢測(cè)方法,包括模型訓(xùn)練過(guò)程和語(yǔ)音活性檢測(cè)過(guò)程;所述模型訓(xùn)練過(guò)程包括以下步驟:S1.對(duì)用于訓(xùn)練的純凈語(yǔ)音確定端點(diǎn)檢測(cè)標(biāo)簽;S2.對(duì)純凈語(yǔ)音進(jìn)行隨機(jī)加噪,構(gòu)造訓(xùn)練集;S3.逐幀處理,提取訓(xùn)練集中的多階多分辨率耳蝸圖特征向量;S4.構(gòu)建多層門控制循環(huán)單元網(wǎng)絡(luò),利用訓(xùn)練集對(duì)其進(jìn)行訓(xùn)練,得到多層門控制循環(huán)單元成熟模型,利用成熟模型進(jìn)行語(yǔ)音活性檢測(cè)。本發(fā)明利用神經(jīng)網(wǎng)絡(luò)良好的分類性能,提取帶噪語(yǔ)音的特定特征,并通過(guò)預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型,對(duì)語(yǔ)音以及噪聲進(jìn)行初步分類并求得一個(gè)語(yǔ)音存在概率;通過(guò)狀態(tài)機(jī)對(duì)獲得的語(yǔ)音存在概率進(jìn)行后處理,從而得到一個(gè)平滑且相對(duì)準(zhǔn)確的語(yǔ)音活性檢測(cè)標(biāo)識(shí)。 |





