一種基于聲學(xué)后驗(yàn)概率的任意說(shuō)話人語(yǔ)音轉(zhuǎn)換系統(tǒng)及方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202011057900.1 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN112634918A | 公開(kāi)(公告)日 | 2021-04-09 |
| 申請(qǐng)公布號(hào) | CN112634918A | 申請(qǐng)公布日 | 2021-04-09 |
| 分類號(hào) | G10L21/013;G10L15/06;G10L13/02;G10L19/16 | 分類 | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 宋丹丹;歐陽(yáng)鵬;尹首一 | 申請(qǐng)(專利權(quán))人 | 江蘇清微智能科技有限公司 |
| 代理機(jī)構(gòu) | 北京索睿邦知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李根 |
| 地址 | 211100 江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號(hào)人工智能產(chǎn)業(yè)園8號(hào)樓3層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)一種基于聲學(xué)后驗(yàn)概率的任意說(shuō)話人語(yǔ)音轉(zhuǎn)換系統(tǒng)及方法,屬于基于深度學(xué)習(xí)的語(yǔ)音轉(zhuǎn)換的技術(shù)技術(shù)領(lǐng)域。包括:一個(gè)語(yǔ)音識(shí)別模型、一個(gè)多說(shuō)話人數(shù)據(jù)集、一個(gè)語(yǔ)音轉(zhuǎn)換模型、一個(gè)目標(biāo)說(shuō)話人數(shù)據(jù)集和一個(gè)LPCNet聲碼器;預(yù)訓(xùn)練一個(gè)語(yǔ)音轉(zhuǎn)換模型,自適應(yīng)訓(xùn)練所述語(yǔ)音轉(zhuǎn)換模型,通過(guò)LPCNet聲碼器完成所述聲學(xué)特征到目標(biāo)說(shuō)話人對(duì)應(yīng)轉(zhuǎn)換語(yǔ)音的合成。本發(fā)明解決了現(xiàn)有技術(shù)中語(yǔ)音轉(zhuǎn)換只能完成特定說(shuō)話人之間且質(zhì)量較低的問(wèn)題。 |





