自適應語音合成方法、裝置、可讀存儲介質及計算設備

基本信息

申請?zhí)?/td> CN201910661648.6 申請日 -
公開(公告)號 CN110379407B 公開(公告)日 2021-10-19
申請公布號 CN110379407B 申請公布日 2021-10-19
分類號 G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學;
發(fā)明人 殷昊 申請(專利權)人 出門問問(蘇州)信息科技有限公司
代理機構 北京鼎承知識產(chǎn)權代理有限公司 代理人 田恩濤;柯宏達
地址 215123江蘇省蘇州市工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園4-B404單元
法律狀態(tài) -

摘要

摘要 本公開實施例提供了一種自適應語音合成方法、裝置、可讀存儲介質及計算設備,用于在僅有少量的且發(fā)音質量不高的語音數(shù)據(jù)的條件下,合成效果不錯的說話人語音。方法包括:獲取基礎語音數(shù)據(jù)和基礎語音數(shù)據(jù)對應的文本數(shù)據(jù);根據(jù)基礎語音數(shù)據(jù)和基礎語音數(shù)據(jù)對應的文本數(shù)據(jù),訓練基礎語音模型;獲取說話人的語音數(shù)據(jù)和說話人的語音數(shù)據(jù)對應的文本數(shù)據(jù);根據(jù)說話人的語音數(shù)據(jù)和說話人的語音數(shù)據(jù)對應的文本數(shù)據(jù),以及基礎語音模型,訓練GRU語音模型;當接收到語音合成指令時,根據(jù)GRU語音模型和指令包含的文字信息,合成說話人的語音。