用音頻特征主成分建立的語音群集來識(shí)別說話人的方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201811118265.6 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN109065059A | 公開(公告)日 | 2018-12-21 |
| 申請(qǐng)公布號(hào) | CN109065059A | 申請(qǐng)公布日 | 2018-12-21 |
| 分類號(hào) | G10L17/08;G10L17/04;G10L17/02 | 分類 | 樂器;聲學(xué); |
| 發(fā)明人 | 陳永清;陳東風(fēng);王貴珊;李瑞娟 | 申請(qǐng)(專利權(quán))人 | 新巴特(安徽)智能科技有限公司 |
| 代理機(jī)構(gòu) | - | 代理人 | - |
| 地址 | 239000 安徽省滁州市世紀(jì)大道801號(hào)昭陽工業(yè)園10號(hào)廠房 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種用音頻特征主成分建立的語音群集來識(shí)別說話人的方法,該方法是將主成分分析和基于音頻特征在主分量空間中的歐幾里得距離的層次聚類相結(jié)合,具體為:收集不同的訓(xùn)練音頻樣本集;計(jì)算每個(gè)樣本的時(shí)域和頻域音頻特征;計(jì)算出時(shí)域和頻域音頻特征的平均值和標(biāo)準(zhǔn)偏差;通過計(jì)算出的數(shù)據(jù)對(duì)訓(xùn)練樣本進(jìn)行主成分分析;將每個(gè)音頻由音頻特征數(shù)據(jù)沿著上述N個(gè)主成分投影的坐標(biāo)來代表;采用UPGMA聚類分析算法,基于n維空間中的距離對(duì)說話人進(jìn)行聚類。本發(fā)明的方法具有速度快,添加新說話人語音方便的特點(diǎn),用于智能語言教學(xué)系統(tǒng),實(shí)現(xiàn)了說話人識(shí)別,從未知的多個(gè)發(fā)言者會(huì)話中及時(shí)分辨說話人,利于針對(duì)性的教學(xué)。 |





