語音識別方法、裝置、計算機設備及計算機可讀存儲介質

基本信息

申請?zhí)?/td> CN201910480466.9 申請日 -
公開(公告)號 CN110265002B 公開(公告)日 2021-07-23
申請公布號 CN110265002B 申請公布日 2021-07-23
分類號 G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L15/16(2006.01)I;G10L15/26(2006.01)I;G10L25/51(2013.01)I 分類 樂器;聲學;
發(fā)明人 劉玲;歐陽鵬;尹首一;李秀東;王博 申請(專利權)人 北京清微智能科技有限公司
代理機構 北京三友知識產(chǎn)權代理有限公司 代理人 王天堯;任默聞
地址 100056北京市海淀區(qū)北四環(huán)西路9號22層2212
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種語音識別方法、裝置、計算機設備及計算機可讀存儲介質,包括:對獲取的音頻數(shù)據(jù)進行降采樣處理,獲得音頻降采樣數(shù)據(jù);將所述音頻降采樣數(shù)據(jù)分成訓練音頻數(shù)據(jù)和測試音頻數(shù)據(jù);對二值化卷積神經(jīng)網(wǎng)絡卷積層和全連接層中的權重進行稀疏化處理,獲得稀疏化的二值化卷積神經(jīng)網(wǎng)絡;利用所述訓練音頻數(shù)據(jù),對所述稀疏化的二值化卷積神經(jīng)網(wǎng)絡進行訓練,獲得訓練好的二值化卷積神經(jīng)網(wǎng)絡;利用所述測試音頻數(shù)據(jù),基于所述訓練好的二值化卷積神經(jīng)網(wǎng)絡進行語音識別。由于該方案通過對二值化卷積神經(jīng)網(wǎng)絡卷積層和全連接層中的權重進行稀疏化處理,可以節(jié)省好多運算空間和時間。