一種適用于車(chē)內(nèi)語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音端點(diǎn)檢測(cè)方法及模塊

基本信息

申請(qǐng)?zhí)?/td> CN202110677109.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113920985A 公開(kāi)(公告)日 2022-01-11
申請(qǐng)公布號(hào) CN113920985A 申請(qǐng)公布日 2022-01-11
分類(lèi)號(hào) G10L15/02(2006.01)I;G10L15/05(2013.01)I;G10L15/06(2013.01)I;G10L25/78(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 姜彥吉;陳濤;張勝;范佳亮;彭博 申請(qǐng)(專(zhuān)利權(quán))人 華研慧聲(蘇州)電子科技有限公司
代理機(jī)構(gòu) 蘇州創(chuàng)元專(zhuān)利商標(biāo)事務(wù)所有限公司 代理人 吳芳
地址 215134江蘇省蘇州市相城區(qū)渭塘鎮(zhèn)愛(ài)格豪路19號(hào)中汽零大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種適用于車(chē)內(nèi)語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音端點(diǎn)檢測(cè)方法及模塊,所述模塊包括語(yǔ)音幀判斷單元和語(yǔ)音幀標(biāo)記單元,所述語(yǔ)音幀判斷單元用于檢測(cè)出實(shí)時(shí)音頻數(shù)據(jù)中的含語(yǔ)音幀,所述語(yǔ)音幀標(biāo)記單元用于根據(jù)所述語(yǔ)音幀判斷單元的檢測(cè)結(jié)果對(duì)所述實(shí)時(shí)音頻數(shù)據(jù)中的含語(yǔ)音幀進(jìn)行標(biāo)記。本發(fā)明提供的適用于車(chē)內(nèi)語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音端點(diǎn)檢測(cè)方法及模塊結(jié)合實(shí)際場(chǎng)景的行車(chē)工況特征,建立多特征融合的端點(diǎn)檢測(cè)模型,采用具有維度差異的模型框架,并結(jié)合語(yǔ)音的語(yǔ)譜圖像特點(diǎn)設(shè)計(jì)卷積核,提升了語(yǔ)音識(shí)別準(zhǔn)確率。