一種低內(nèi)存消耗的高效離線命令詞識別系統(tǒng)和建模方法

基本信息

申請?zhí)?/td> CN202111061384.4 申請日 -
公開(公告)號 CN113963690A 公開(公告)日 2022-01-21
申請公布號 CN113963690A 申請公布日 2022-01-21
分類號 G10L15/16(2006.01)I;G10L15/22(2006.01)I;G10L15/20(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I;G10L25/87(2013.01)I;G06N3/08(2006.01)I;G06F17/16(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 唐浩元;馬殿昌;王歡良;張李;王佳珺;黃正林 申請(專利權(quán))人 蘇州奇夢者科技有限公司
代理機(jī)構(gòu) 蘇州銘浩知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 于浩江
地址 215000江蘇省蘇州市中國(江蘇)自由貿(mào)易試驗(yàn)區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號E1905室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種低內(nèi)存消耗的高效離線命令詞識別系統(tǒng)和建模方法,涉及語音識別技術(shù)領(lǐng)域;方法包括:提供一種模型參數(shù)壓縮方法,對神經(jīng)網(wǎng)絡(luò)模型每一層的矩陣逐行進(jìn)行壓縮,將模型參數(shù)存儲內(nèi)存消耗降低70%~75%,同時將模型前向運(yùn)算的矩陣浮點(diǎn)乘法運(yùn)算轉(zhuǎn)換成16位整型乘法運(yùn)算,降低系統(tǒng)的計(jì)算復(fù)雜度;在解碼網(wǎng)絡(luò)中除命令詞路徑之外添加filler路徑,用于解決命令詞識別中的強(qiáng)噪聲下的誤識別問題;采用改進(jìn)的解碼器,在音頻解碼過程中實(shí)時對解碼網(wǎng)格中的節(jié)點(diǎn)進(jìn)行合并,極大的減少了解碼網(wǎng)格中的節(jié)點(diǎn)數(shù)目,在不影響解碼性能的基礎(chǔ)上將解碼的內(nèi)存消耗降低75%~90%。