一種英語(yǔ)口語(yǔ)發(fā)音自動(dòng)糾正方法和裝置
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110139760.0 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN112466279B | 公開(kāi)(公告)日 | 2021-05-18 |
| 申請(qǐng)公布號(hào) | CN112466279B | 申請(qǐng)公布日 | 2021-05-18 |
| 分類號(hào) | G10L15/00;G10L15/06;G10L15/08;G10L15/14;G10L15/16;G10L13/04;G10L25/03 | 分類 | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 王志彬 | 申請(qǐng)(專利權(quán))人 | 深圳市阿卡索資訊股份有限公司 |
| 代理機(jī)構(gòu) | 深圳市智勝聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 齊文劍 |
| 地址 | 518000 廣東省深圳市羅湖區(qū)筍崗街道筍西社區(qū)桃園路260號(hào)HALO廣場(chǎng)四期九層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實(shí)施例提供了一種英語(yǔ)口語(yǔ)發(fā)音自動(dòng)糾正方法和裝置,將采集到的音頻文件轉(zhuǎn)化成數(shù)字信號(hào),并進(jìn)行降噪處理和特征提取,得到反映語(yǔ)音信號(hào)特征的關(guān)鍵特征參數(shù),利用預(yù)訓(xùn)練的聲學(xué)模型、語(yǔ)言模型及所有英文單詞和短語(yǔ)組成的字典語(yǔ)料庫(kù)建立識(shí)別網(wǎng)絡(luò),在所述識(shí)別網(wǎng)絡(luò)中搜索與所述特征矢量序列匹配度最高的詞串,將用法有誤的單詞和/或短語(yǔ)提取,利用語(yǔ)法和時(shí)態(tài)算法規(guī)則進(jìn)行修正,采用所述聲學(xué)模型生成對(duì)應(yīng)的特征向量,并從預(yù)設(shè)語(yǔ)音素材庫(kù)中匹配與其對(duì)應(yīng)的語(yǔ)音素材,利用所述語(yǔ)音素材和所述特征向量反編碼得到目標(biāo)音頻文件。反映語(yǔ)音信號(hào)特征的關(guān)鍵特征參數(shù)能夠直接獲得音素序列,提高語(yǔ)音識(shí)別度,能幫助語(yǔ)音合成更準(zhǔn)確的音頻,提高人聲相似度。 |





