一種語(yǔ)音合成模型的評(píng)價(jià)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202011148521.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112466272A 公開(kāi)(公告)日 2021-03-09
申請(qǐng)公布號(hào) CN112466272A 申請(qǐng)公布日 2021-03-09
分類(lèi)號(hào) G10L13/02(2013.01)I;G10L13/04(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 陸健;徐欣康;胡新輝 申請(qǐng)(專(zhuān)利權(quán))人 浙江同花順智能科技有限公司
代理機(jī)構(gòu) 北京品源專(zhuān)利代理有限公司 代理人 孟金喆
地址 310023浙江省杭州市余杭區(qū)五常街道同順街18號(hào)3樓305室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開(kāi)了一種語(yǔ)音合成模型的評(píng)價(jià)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。其中,該方法包括:當(dāng)輸入文本通過(guò)預(yù)設(shè)模型合成語(yǔ)音輸出時(shí),生成第一權(quán)重矩陣,所述預(yù)設(shè)模型為基于注意力機(jī)制的端到端語(yǔ)音合成模型,所述第一權(quán)重矩陣中的元素表示所述語(yǔ)音的語(yǔ)音幀對(duì)齊所述輸入文本的字符的概率;確定第一權(quán)重矩陣中每個(gè)權(quán)重的重要程度指數(shù),并根據(jù)所述每個(gè)權(quán)重的重要程度指數(shù)形成第二權(quán)重矩陣;通過(guò)第一權(quán)重矩陣和第二權(quán)重矩陣確定所述預(yù)設(shè)模型的得分,所述得分用于表征預(yù)設(shè)模型的效果。本發(fā)明實(shí)施例提供的技術(shù)方案,不需要額外的語(yǔ)音識(shí)別模塊,提高了語(yǔ)音合成模型評(píng)價(jià)結(jié)果的準(zhǔn)確性,有利于提高預(yù)設(shè)模型的訓(xùn)練效率。??