一種基于UNET結(jié)構(gòu)利用傳聲器陣列語音源定位方法
基本信息

| 申請?zhí)?/td> | 2020110965745 | 申請日 | - |
| 公開(公告)號 | CN112269158A | 公開(公告)日 | 2021-01-26 |
| 申請公布號 | CN112269158A | 申請公布日 | 2021-01-26 |
| 分類號 | G01S3/80(2006.01)I; | 分類 | 測量;測試; |
| 發(fā)明人 | 王浩;盧晶;劉曉峻;狄敏;姚志強 | 申請(專利權(quán))人 | 江蘇南大電子信息技術(shù)股份有限公司 |
| 代理機構(gòu) | 南京瑞弘專利商標事務(wù)所(普通合伙) | 代理人 | 彭雄 |
| 地址 | 210019江蘇省南京市建鄴區(qū)白龍江東街8號科技綜合A區(qū)1幢14層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于UNET結(jié)構(gòu)利用傳聲器陣列語音源定位方法,步驟如下:(1)生成訓(xùn)練樣本,得到時?頻域信號,并獲得功率包絡(luò);(2)對時?頻域信號的每個時?頻點,計算對應(yīng)的語音能量占比和直達路徑語音能量占比;(3)利用步驟(1)生成的樣本訓(xùn)練多任務(wù)UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò);(4)利用已訓(xùn)練的多任務(wù)UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)預(yù)測待測含噪信號每個時?頻點語音直達聲能量占比;(5)對判斷語音直達聲能量占比較高的時?頻點,應(yīng)用定位方法,得到定位結(jié)果。本發(fā)明的語音聲源定位方法,能夠使得在高混響及高干擾的環(huán)境中,有效去除干擾和混響的影響,獲得精確度和魯棒性較高的結(jié)果。?? |





