一種基于循環(huán)損失的語音轉(zhuǎn)換方法及裝置
基本信息

| 申請?zhí)?/td> | CN202210201058.7 | 申請日 | - |
| 公開(公告)號 | CN114283824B | 公開(公告)日 | 2022-07-08 |
| 申請公布號 | CN114283824B | 申請公布日 | 2022-07-08 |
| 分類號 | G10L19/16(2013.01)I | 分類 | 樂器;聲學(xué); |
| 發(fā)明人 | 鄭方;李鵬琦;李藍天;徐明星;萬化;張琛;潘仰耀;謝弈崢 | 申請(專利權(quán))人 | 上海浦東發(fā)展銀行股份有限公司 |
| 代理機構(gòu) | 北京路浩知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
| 地址 | 100084北京市海淀區(qū)雙清路30號清華大學(xué) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種基于循環(huán)損失的語音轉(zhuǎn)換方法及裝置,所述方法包括:獲取不同說話人的語音信息;將所述語音信息輸入至訓(xùn)練好的語音轉(zhuǎn)換模型中,基于所述語音轉(zhuǎn)換模型的共享編碼器和解碼器轉(zhuǎn)換為重構(gòu)語音信息;獲取所述重構(gòu)語音與語音信息之間的循環(huán)損失,并基于所述循環(huán)損失對所述語音信息進行語音內(nèi)容信息以及說話人風(fēng)格信息的分離;其中,所述語音轉(zhuǎn)換模型是基于不同語音樣本以及樣本的語音轉(zhuǎn)換結(jié)果訓(xùn)練得到的。本發(fā)明能夠基于循環(huán)損失實現(xiàn)語音內(nèi)容信息以及說話人風(fēng)格信息的分離,從而提高了語音轉(zhuǎn)換的效率和語音轉(zhuǎn)換質(zhì)量。 |





