基于多通道小波分解共同降噪的深度學習聲紋識別方法
基本信息

| 申請?zhí)?/td> | CN202111480885.6 | 申請日 | - |
| 公開(公告)號 | CN113903344B | 公開(公告)日 | 2022-03-11 |
| 申請公布號 | CN113903344B | 申請公布日 | 2022-03-11 |
| 分類號 | G10L17/02(2013.01)I;G10L17/18(2013.01)I | 分類 | 樂器;聲學; |
| 發(fā)明人 | 曹祖楊;杜子哲;張凱強 | 申請(專利權)人 | 杭州兆華電子股份有限公司 |
| 代理機構 | 上海專利商標事務所有限公司 | 代理人 | 胡林嶺 |
| 地址 | 311121 浙江省杭州市余杭區(qū)中泰街道仙橋路10號3幢 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種基于多通道小波分解共同降噪的深度學習聲紋識別方法,包括:a.進行多個通道信號采集;b.通過陣列計算來波方向;c.對信號預處理;d.對預處理后的每幀信號進行傅立葉變換;將實際頻率轉換到梅爾頻率;確定信號幅值超過閾值的極大值;確定極大值所對應的頻率ω1,…,ωN;?。é豱+ωn+1)/2作為相鄰分段的邊界,將信號頻率范圍等分為N個區(qū)間;并再從梅爾頻率轉換回實際頻率;e.對步驟d處理后的信號按照所述N個區(qū)間進行小波變換;f.對每個模態(tài)采用硬處理方式進行降噪,將每個模態(tài)與預處理后的信號做互相關運算,選取互相關值超過設定閾值所對應的模態(tài);g.根據(jù)對所選取的模態(tài)得到語音信息矩陣;h.將語音信息矩陣輸入基于注意力機制模型的卷積神經(jīng)網(wǎng)絡,識別聲紋所屬對象。 |





