一種實時變聲的方法、裝置及電子設(shè)備
基本信息

| 申請?zhí)?/td> | CN202110463732.4 | 申請日 | - |
| 公開(公告)號 | CN113362807A | 公開(公告)日 | 2021-09-07 |
| 申請公布號 | CN113362807A | 申請公布日 | 2021-09-07 |
| 分類號 | G10L15/02;G10L15/06;G10L15/22;G10L19/16;G10L21/013 | 分類 | 樂器;聲學; |
| 發(fā)明人 | 戈文碩;劉愷;陳偉 | 申請(專利權(quán))人 | 北京搜狗智能科技有限公司 |
| 代理機構(gòu) | 北京華沛德權(quán)律師事務(wù)所 | 代理人 | 房德權(quán) |
| 地址 | 100084 北京市海淀區(qū)中關(guān)村東路1號院9號樓8層802 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種實時變聲的方法,獲取源說話人的原語音數(shù)據(jù);通過語音識別模型提取原始音頻識別特征;將所述原始音頻識別特征輸入到目標變聲模型中,輸出所述目標說話人的聲學特征;將所述目標說話人的聲學特征以所述目標語音進行輸出。上述技術(shù)方案中,由于語音識別模型的參數(shù)量小于第一設(shè)定參數(shù)量,且目標變聲模型的參數(shù)量小于第二設(shè)定參數(shù)量,使得語音識別模型和目標變聲模型均為小模型,且采用了流式調(diào)度特征提取,如此,能夠極大的縮減計算量,從而能夠?qū)崿F(xiàn)低響應(yīng)延遲的實時變聲的效果。 |





