一種基于循環(huán)損失的語音轉(zhuǎn)換方法及裝置

基本信息

申請?zhí)?/td> CN202210201058.7 申請日 -
公開(公告)號 CN114283824B 公開(公告)日 2022-07-08
申請公布號 CN114283824B 申請公布日 2022-07-08
分類號 G10L19/16(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 鄭方;李鵬琦;李藍天;徐明星;萬化;張琛;潘仰耀;謝弈崢 申請(專利權(quán))人 上海浦東發(fā)展銀行股份有限公司
代理機構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100084北京市海淀區(qū)雙清路30號清華大學(xué)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于循環(huán)損失的語音轉(zhuǎn)換方法及裝置,所述方法包括:獲取不同說話人的語音信息;將所述語音信息輸入至訓(xùn)練好的語音轉(zhuǎn)換模型中,基于所述語音轉(zhuǎn)換模型的共享編碼器和解碼器轉(zhuǎn)換為重構(gòu)語音信息;獲取所述重構(gòu)語音與語音信息之間的循環(huán)損失,并基于所述循環(huán)損失對所述語音信息進行語音內(nèi)容信息以及說話人風(fēng)格信息的分離;其中,所述語音轉(zhuǎn)換模型是基于不同語音樣本以及樣本的語音轉(zhuǎn)換結(jié)果訓(xùn)練得到的。本發(fā)明能夠基于循環(huán)損失實現(xiàn)語音內(nèi)容信息以及說話人風(fēng)格信息的分離,從而提高了語音轉(zhuǎn)換的效率和語音轉(zhuǎn)換質(zhì)量。