聲碼器語(yǔ)音合成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111139651.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113744715A 公開(kāi)(公告)日 2021-12-03
申請(qǐng)公布號(hào) CN113744715A 申請(qǐng)公布日 2021-12-03
分類(lèi)號(hào) G10L13/08(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 黃元忠;魏靜;盧慶華 申請(qǐng)(專(zhuān)利權(quán))人 深圳市木愚科技有限公司
代理機(jī)構(gòu) 深圳市精英專(zhuān)利事務(wù)所 代理人 李燕娥
地址 518000廣東省深圳市南山區(qū)南頭街道馬家龍社區(qū)大新路198號(hào)創(chuàng)新大廈B棟1101
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開(kāi)了聲碼器語(yǔ)音合成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。所述方法包括:獲取待合成文本文件;將所述待合成文本文件輸入至聲譜預(yù)測(cè)網(wǎng)絡(luò)內(nèi)進(jìn)行提取聲學(xué)特征,以得到梅爾頻譜;將所述梅爾頻譜輸入至改進(jìn)的多尺度HiFi?GAN聲碼器模型內(nèi)進(jìn)行語(yǔ)音合成,以得到語(yǔ)音音頻。通過(guò)實(shí)施本發(fā)明實(shí)施例的方法可實(shí)現(xiàn)快速且有效地提高整個(gè)生成波形的最終表現(xiàn),提升語(yǔ)音合成音頻的音質(zhì)。