語(yǔ)音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110441718.4 申請(qǐng)日 -
公開(公告)號(hào) CN113345422A 公開(公告)日 2021-09-03
申請(qǐng)公布號(hào) CN113345422A 申請(qǐng)公布日 2021-09-03
分類號(hào) G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 王亞東 申請(qǐng)(專利權(quán))人 北京巔峰科技有限公司
代理機(jī)構(gòu) 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 姜鳳巖;朱文杰
地址 100085北京市海淀區(qū)上地信息產(chǎn)業(yè)基地三街1號(hào)樓四層C段402
法律狀態(tài) -

摘要

摘要 本說(shuō)明書一個(gè)或多個(gè)實(shí)施例提供了一種語(yǔ)音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),其中方法包括:獲取待處理的語(yǔ)音數(shù)據(jù);在各預(yù)設(shè)的語(yǔ)音數(shù)據(jù)處理操作中隨機(jī)選取目標(biāo)語(yǔ)音處理操作;所述各預(yù)設(shè)的語(yǔ)音數(shù)據(jù)處理操作包括:時(shí)域掩碼、頻域掩碼、音高變換、音量變換、音頻加噪;獲取所述目標(biāo)語(yǔ)音處理操作的語(yǔ)音處理參數(shù)所對(duì)應(yīng)的取值范圍,在所述取值范圍內(nèi),隨機(jī)選取所述目標(biāo)語(yǔ)音處理操作的語(yǔ)音處理參數(shù)的參數(shù)值;基于所述參數(shù)值,利用所述目標(biāo)語(yǔ)音處理操作對(duì)所述待處理的語(yǔ)音數(shù)據(jù)進(jìn)行處理。通過(guò)本實(shí)施例,能夠解決目前擴(kuò)充語(yǔ)音識(shí)別模型的訓(xùn)練樣本的數(shù)據(jù)量時(shí),擴(kuò)充過(guò)程復(fù)雜、擴(kuò)充成本高的問題。