一種基于耳腔振動的靜默語音采集處理方法及設(shè)備

基本信息

申請?zhí)?/td> CN202111118423.X 申請日 -
公開(公告)號 CN113810819B 公開(公告)日 2022-06-28
申請公布號 CN113810819B 申請公布日 2022-06-28
分類號 H04R1/10(2006.01)I;G10L15/02(2006.01)I;G10L15/26(2006.01)I;G10L21/0364(2013.01)I 分類 電通信技術(shù);
發(fā)明人 劉杰;蓋鑫;戴國忠;田豐 申請(專利權(quán))人 中國科學(xué)院軟件研究所
代理機構(gòu) 北京君尚知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100190北京市海淀區(qū)中關(guān)村南四街4號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于耳腔振動的靜默語音采集處理方法及設(shè)備。本方法為:1)靜默語音采集單元持續(xù)監(jiān)測佩戴者耳腔的震動信號,當(dāng)震動信號的震動幅度或頻率變化高于設(shè)定閾值時,該靜默語音采集單元中的空氣振動傳感器、骨振動傳感器同時開始進(jìn)行信號采集,并將采集的信號發(fā)送到數(shù)據(jù)處理端;2)數(shù)據(jù)處理端接收到信號后,以設(shè)定時間長度為基本單位,將采集的連續(xù)語音信號、震動信號分別劃分為若干幀,并計算每一幀的平均能量及平均頻率,然后根據(jù)計算結(jié)果與設(shè)定能量閾值進(jìn)行比較判斷用戶是傳統(tǒng)語音輸入或靜默語音輸入;3)對于傳統(tǒng)語音輸入,調(diào)用端到端語音識別模型進(jìn)行語音內(nèi)容識別;對于靜默語音輸入,則采用卷積神經(jīng)網(wǎng)絡(luò)模型對采集到的震動信號進(jìn)行特征提取、融合與內(nèi)容識別。