一種基于音素信息的聲紋認證系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN201610880776.6 申請日 -
公開(公告)號 CN106448685A 公開(公告)日 2017-02-22
申請公布號 CN106448685A 申請公布日 2017-02-22
分類號 G10L17/06(2013.01)I;G10L17/02(2013.01)I;G10L17/04(2013.01)I;G10L17/18(2013.01)I 分類 樂器;聲學;
發(fā)明人 鄭榕;張策;王黎明 申請(專利權(quán))人 北京遠鑒科技股份有限公司
代理機構(gòu) 北京中海智圣知識產(chǎn)權(quán)代理有限公司 代理人 白鳳武
地址 100142 北京市海淀區(qū)西四環(huán)北路158號1幢9層東區(qū)9A
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于音素信息的聲紋認證系統(tǒng)及方法,系統(tǒng)包括基于漢語普通話語音識別器的音素強制對齊模塊、音素相關(guān)的模型創(chuàng)建模塊和基于dropout策略的神經(jīng)網(wǎng)絡(luò)分類器模塊;方法包括定義漢語普通話數(shù)字串聲紋的十六個音素類別,顯式利用數(shù)字串的各個發(fā)音類別信息;基于漢語普通話語音識別器,采用維特比強制對齊算法獲取每個對應(yīng)數(shù)字串文本內(nèi)容的音素邊界;采用文本無關(guān)算法建立音素相關(guān)模型;計算音素相關(guān)模型,得到分數(shù)向量。本發(fā)明的有益效果:本發(fā)明在實現(xiàn)音素信息切分、音素建模和音素相關(guān)模型區(qū)分能力分析的同時,提出了采用dropout策略的神經(jīng)網(wǎng)絡(luò)訓練方法,解決了數(shù)字串音素缺失的問題,并提高了數(shù)字串聲紋認證系統(tǒng)的性能。