一種基于聲學(xué)后驗(yàn)概率的任意說(shuō)話人語(yǔ)音轉(zhuǎn)換系統(tǒng)及方法

基本信息

申請(qǐng)?zhí)?/td> CN202011057900.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112634918A 公開(kāi)(公告)日 2021-04-09
申請(qǐng)公布號(hào) CN112634918A 申請(qǐng)公布日 2021-04-09
分類號(hào) G10L21/013;G10L15/06;G10L13/02;G10L19/16 分類 樂(lè)器;聲學(xué);
發(fā)明人 宋丹丹;歐陽(yáng)鵬;尹首一 申請(qǐng)(專利權(quán))人 江蘇清微智能科技有限公司
代理機(jī)構(gòu) 北京索睿邦知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李根
地址 211100 江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號(hào)人工智能產(chǎn)業(yè)園8號(hào)樓3層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)一種基于聲學(xué)后驗(yàn)概率的任意說(shuō)話人語(yǔ)音轉(zhuǎn)換系統(tǒng)及方法,屬于基于深度學(xué)習(xí)的語(yǔ)音轉(zhuǎn)換的技術(shù)技術(shù)領(lǐng)域。包括:一個(gè)語(yǔ)音識(shí)別模型、一個(gè)多說(shuō)話人數(shù)據(jù)集、一個(gè)語(yǔ)音轉(zhuǎn)換模型、一個(gè)目標(biāo)說(shuō)話人數(shù)據(jù)集和一個(gè)LPCNet聲碼器;預(yù)訓(xùn)練一個(gè)語(yǔ)音轉(zhuǎn)換模型,自適應(yīng)訓(xùn)練所述語(yǔ)音轉(zhuǎn)換模型,通過(guò)LPCNet聲碼器完成所述聲學(xué)特征到目標(biāo)說(shuō)話人對(duì)應(yīng)轉(zhuǎn)換語(yǔ)音的合成。本發(fā)明解決了現(xiàn)有技術(shù)中語(yǔ)音轉(zhuǎn)換只能完成特定說(shuō)話人之間且質(zhì)量較低的問(wèn)題。