一種采用感知聽覺場景分析的缺失數(shù)據(jù)特征說話人識別方法
基本信息

| 申請?zhí)?/td> | CN201610114968.6 | 申請日 | - |
| 公開(公告)號 | CN106448680B | 公開(公告)日 | 2019-11-12 |
| 申請公布號 | CN106448680B | 申請公布日 | 2019-11-12 |
| 分類號 | G10L17/02(2013.01)I; G10L17/20(2013.01)I | 分類 | 樂器;聲學; |
| 發(fā)明人 | 吳迪; 陶智; 趙鶴鳴; 張曉俊; 肖仲喆; 馮哲 | 申請(專利權(quán))人 | 常熟蘇大低碳應用技術(shù)研究院有限公司 |
| 代理機構(gòu) | 南京知識律師事務所 | 代理人 | 汪旭東 |
| 地址 | 215500 江蘇省蘇州市常熟市東南經(jīng)濟開發(fā)區(qū)東南大道68號1幢 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明針對現(xiàn)有的缺失數(shù)據(jù)特征方法在低信噪比環(huán)境下魯棒性較差的問題,提出了一種感知聽覺場景分析(Perception Auditory Scene Analysis,PASA)的MDF提取方法,進一步提高MDF方法的魯棒性。PASA方法解決了兩個關(guān)鍵問題。一,由oracle掩碼估計出的可靠語音并不完全正確,特別在低信噪比的情況下,噪聲的隨機特性導致很多噪聲特征譜被估計成語音特征譜。二,在低信噪比的情況下,缺失數(shù)據(jù)特征的方法在提取特征時,有一些語音的場景,被估計出的可靠部分很少,不可靠部分很多。這種語音幀的不可靠部分全部由補償?shù)闹荡?,由此估計出的特征譜的魯棒性較差。本發(fā)明解決了這兩個問題。 |





