針對(duì)目標(biāo)說(shuō)話人提取的單通道語(yǔ)音分離方法及系統(tǒng)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202011057722.2 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN111899757B | 公開(kāi)(公告)日 | 2021-01-12 |
| 申請(qǐng)公布號(hào) | CN111899757B | 申請(qǐng)公布日 | 2021-01-12 |
| 分類號(hào) | G10L21/0272;G10L21/028;G10L25/30 | 分類 | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 史慧宇;歐陽(yáng)鵬 | 申請(qǐng)(專利權(quán))人 | 南京蘊(yùn)智科技有限公司 |
| 代理機(jī)構(gòu) | 北京索睿邦知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李根 |
| 地址 | 211100 江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號(hào)人工智能產(chǎn)業(yè)園8號(hào)樓4樓 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了針對(duì)目標(biāo)說(shuō)話人提取的單通道語(yǔ)音分離方法,包括:獲取目標(biāo)說(shuō)話人混合語(yǔ)音樣本。根據(jù)初始化后的初始深度神經(jīng)網(wǎng)絡(luò)模型參數(shù),訓(xùn)練初始深度神經(jīng)網(wǎng)絡(luò)模型獲取第一深度神經(jīng)網(wǎng)絡(luò)模型。生成第二深度神經(jīng)網(wǎng)絡(luò)模型。初始化第二深度神經(jīng)網(wǎng)絡(luò)模型。獲取當(dāng)前深度神經(jīng)網(wǎng)絡(luò)模型。根據(jù)估計(jì)掩蔽及目標(biāo)說(shuō)話人混合語(yǔ)音樣本的音頻獲取目標(biāo)說(shuō)話人語(yǔ)音樣本。本發(fā)明中的針對(duì)目標(biāo)說(shuō)話人提取的單通道語(yǔ)音分離方法比現(xiàn)有的目標(biāo)說(shuō)話人提取單通道語(yǔ)音分離方法能在提高分離準(zhǔn)確度、說(shuō)話可懂度的同時(shí),縮小算法的網(wǎng)絡(luò)模型尺寸,減少計(jì)算內(nèi)存,增強(qiáng)算法落地實(shí)現(xiàn)的有效性。同時(shí),本發(fā)明還提供了針對(duì)目標(biāo)說(shuō)話人提取的單通道語(yǔ)音分離系統(tǒng)。 |





