語(yǔ)音合成方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110783989.8 申請(qǐng)日 -
公開(公告)號(hào) CN113409761A 公開(公告)日 2021-09-17
申請(qǐng)公布號(hào) CN113409761A 申請(qǐng)公布日 2021-09-17
分類號(hào) G10L13/02(2013.01)I;G10L13/04(2013.01)I;G10L13/10(2013.01)I;G10L25/18(2013.01)I;G10L25/21(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 葉劍豪;蘇志霸;周鴻斌;林怡亭;李林;任凱盟;賀天威;賀雯迪;盧恒 申請(qǐng)(專利權(quán))人 上海喜馬拉雅科技有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 張欣欣
地址 201100上海市閔行區(qū)紫星路588號(hào)2幢2062室
法律狀態(tài) -

摘要

摘要 本發(fā)明的實(shí)施例提供了一種語(yǔ)音合成方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),方法包括:確定待合成文本;將待合成文本轉(zhuǎn)化為待合成國(guó)際音標(biāo)對(duì)應(yīng)的第一ID序列和國(guó)際音標(biāo)對(duì)應(yīng)的聲調(diào)ID;確定用戶選擇的目標(biāo)對(duì)象的ID和標(biāo)準(zhǔn)對(duì)象的ID;輸入至語(yǔ)音合成模型中語(yǔ)音合成模型,依據(jù)待合成文本的待合成國(guó)際音標(biāo)序列,預(yù)測(cè)每個(gè)待合成國(guó)際音標(biāo)的時(shí)長(zhǎng),語(yǔ)音合成模型根據(jù)待合成國(guó)際音標(biāo)對(duì)應(yīng)的第一ID序列、國(guó)際音標(biāo)對(duì)應(yīng)的聲調(diào)ID、每個(gè)待合成國(guó)際音標(biāo)的時(shí)長(zhǎng)、目標(biāo)對(duì)象的ID以及標(biāo)準(zhǔn)對(duì)象的ID進(jìn)行處理,輸出待合成文本的聲學(xué)特征。能夠使得對(duì)象在合成非本土語(yǔ)言的時(shí)候,能夠使用本土說(shuō)話人,即標(biāo)準(zhǔn)對(duì)象的韻律,最終得到更好的語(yǔ)音合成自然度。