一種基于CTC的聲學模型訓練方法
基本信息

| 申請?zhí)?/td> | CN201710002096.9 | 申請日 | - |
| 公開(公告)號 | CN108269568B | 公開(公告)日 | 2021-07-30 |
| 申請公布號 | CN108269568B | 申請公布日 | 2021-07-30 |
| 分類號 | G10L15/14(2006.01)I;G10L15/16(2006.01)I;G10L15/02(2006.01)I | 分類 | 樂器;聲學; |
| 發(fā)明人 | 張鵬遠;王智超;潘接林;顏永紅 | 申請(專利權)人 | 北京中科信利技術有限公司 |
| 代理機構 | 北京方安思達知識產(chǎn)權代理有限公司 | 代理人 | 王宇楊;楊青 |
| 地址 | 100190北京市海淀區(qū)北四環(huán)西路21號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種基于CTC的聲學模型訓練的方法,該方法包括:步驟1、訓練一個初始的GMM模型,用該GMM模型對訓練數(shù)據(jù)的文本標注進行時間點強制對齊,得到每個音素所對應的時間區(qū)域;步驟2、在每個音素后插入一個與該音素相關的“空白”符號,每個音素擁有一個特有的“空白”符號;步驟3、采用有限狀態(tài)機,對加入“空白”符號后的音素標注序列構建一個CTC前后向計算的搜索路徑圖;步驟4、根據(jù)時間對齊結果,對每個音素出現(xiàn)的時間范圍進行限制,并對該搜索路徑圖進行剪枝,將音素位置超出時間限制的路徑減掉,得到最終CTC計算網(wǎng)絡誤差時所需的搜索路徑圖;步驟5、采用延時神經(jīng)網(wǎng)絡(Time?delay Neural Network,TDNN)結構結合CTC方法進行聲學模型訓練,得到最終的TDNN?CTC聲學模型。 |





