一種語音數(shù)據(jù)的識別方法及裝置
基本信息

| 申請?zhí)?/td> | CN202011578798.X | 申請日 | - |
| 公開(公告)號 | CN112786051A | 公開(公告)日 | 2021-05-11 |
| 申請公布號 | CN112786051A | 申請公布日 | 2021-05-11 |
| 分類號 | G10L15/26;G10L15/18 | 分類 | 樂器;聲學(xué); |
| 發(fā)明人 | 楊超;陳曉宇;張彬彬;曾晨晨 | 申請(專利權(quán))人 | 出門問問(蘇州)信息科技有限公司 |
| 代理機構(gòu) | 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉婧 |
| 地址 | 215000 江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園4-B404單元 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開一種語音數(shù)據(jù)的識別方法及裝置,該方法包括:采集第一語音訓(xùn)練集,根據(jù)第一語音訓(xùn)練集得到一級語音識別模型;采集第一語音評估集,對應(yīng)第一文本數(shù)據(jù)集;對第一語音評估集分別從預(yù)設(shè)的多個維度進行變換處理,得到多個語音評估集;使用一級語音識別模型分別對多個語音評估集進行識別,得到多個文本數(shù)據(jù)集;將多個文本數(shù)據(jù)集與第一文本數(shù)據(jù)集進行比對,得到多個語音文本識別錯誤率;根據(jù)多個語音文本識別錯誤率確定使用對應(yīng)維度對第一語音訓(xùn)練集進行變換處理的占比;根據(jù)多個占比對第一語音訓(xùn)練集中相應(yīng)數(shù)量的語音樣本數(shù)據(jù)進行變換處理得到第二語音訓(xùn)練集;使用第二語音訓(xùn)練集對所述一級語音識別模型進行訓(xùn)練,得到二級語音識別模型。 |





