一種語音數(shù)據(jù)的識別方法及裝置

基本信息

申請?zhí)?/td> CN202011578798.X 申請日 -
公開(公告)號 CN112786051A 公開(公告)日 2021-05-11
申請公布號 CN112786051A 申請公布日 2021-05-11
分類號 G10L15/26;G10L15/18 分類 樂器;聲學(xué);
發(fā)明人 楊超;陳曉宇;張彬彬;曾晨晨 申請(專利權(quán))人 出門問問(蘇州)信息科技有限公司
代理機構(gòu) 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉婧
地址 215000 江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園4-B404單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種語音數(shù)據(jù)的識別方法及裝置,該方法包括:采集第一語音訓(xùn)練集,根據(jù)第一語音訓(xùn)練集得到一級語音識別模型;采集第一語音評估集,對應(yīng)第一文本數(shù)據(jù)集;對第一語音評估集分別從預(yù)設(shè)的多個維度進行變換處理,得到多個語音評估集;使用一級語音識別模型分別對多個語音評估集進行識別,得到多個文本數(shù)據(jù)集;將多個文本數(shù)據(jù)集與第一文本數(shù)據(jù)集進行比對,得到多個語音文本識別錯誤率;根據(jù)多個語音文本識別錯誤率確定使用對應(yīng)維度對第一語音訓(xùn)練集進行變換處理的占比;根據(jù)多個占比對第一語音訓(xùn)練集中相應(yīng)數(shù)量的語音樣本數(shù)據(jù)進行變換處理得到第二語音訓(xùn)練集;使用第二語音訓(xùn)練集對所述一級語音識別模型進行訓(xùn)練,得到二級語音識別模型。