語音真?zhèn)蔚尿炞C方法、裝置、電子設(shè)備及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110433396.9 申請日 -
公開(公告)號 CN112992126B 公開(公告)日 2022-02-25
申請公布號 CN112992126B 申請公布日 2022-02-25
分類號 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L25/51(2013.01)I 分類 樂器;聲學;
發(fā)明人 鄭榕;鄭堯曦 申請(專利權(quán))人 北京遠鑒信息技術(shù)有限公司
代理機構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 劉鳳
地址 100000北京市海淀區(qū)西四環(huán)北路158號1幢7層80001-2
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝苏Z音真?zhèn)蔚尿炞C方法、裝置、電子設(shè)備及可讀存儲介質(zhì),包括:獲取待識別語音;將待識別語音輸入預(yù)先訓(xùn)練好的聲音特征提取網(wǎng)絡(luò),得到目標特征向量;目標特征向量包含用于區(qū)分聲音來源的待識別語音的時序信息以及音素長時對應(yīng)信息;將目標特征向量輸入至預(yù)先訓(xùn)練好的分類模型中,確定待識別語音是否為真實用戶發(fā)出的;分類模型是基于最大互信息準則進行訓(xùn)練的,用于區(qū)分真實語音與偽造語音。這樣,可以提取出針對于語音活體檢測的聲音特征,有助于提高識別待識別語音是否是來自于真實用戶的準確率,同時利用區(qū)分度更高更不易混淆的分類模型進行分類,可以提高對聲音分類的準確性,從而提高了對語音是否為真實用戶發(fā)出的識別的準確性。