一種跨場(chǎng)景快速適應(yīng)的語(yǔ)音識(shí)別方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010305374.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111477211A 公開(kāi)(公告)日 2020-07-31
申請(qǐng)公布號(hào) CN111477211A 申請(qǐng)公布日 2020-07-31
分類(lèi)號(hào) G10L15/02(2006.01)I 分類(lèi) -
發(fā)明人 李新宇 申請(qǐng)(專(zhuān)利權(quán))人 珠海聲原智能科技有限公司
代理機(jī)構(gòu) 北京匯彩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 珠海聲原智能科技有限公司
地址 519000廣東省珠海市香洲區(qū)吉大景山路蓮山巷8號(hào)8樓A802單元
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種跨場(chǎng)景快速適應(yīng)的語(yǔ)音識(shí)別方法和裝置,通過(guò)通用數(shù)據(jù)在不同場(chǎng)景的真實(shí)錄放,真實(shí)大規(guī)模生成場(chǎng)景訓(xùn)練語(yǔ)音數(shù)據(jù),從而達(dá)到對(duì)場(chǎng)景的快速語(yǔ)音適應(yīng),具有快速、低成本和高效的優(yōu)勢(shì),助力語(yǔ)音識(shí)別多場(chǎng)景的落地應(yīng)用。包括以下步驟:首先選取滿(mǎn)足要求的基礎(chǔ)語(yǔ)音;然后將選取的基礎(chǔ)語(yǔ)音在需要適應(yīng)的場(chǎng)景中進(jìn)行場(chǎng)景語(yǔ)音生成,通過(guò)高保真放音設(shè)備進(jìn)行基礎(chǔ)語(yǔ)音播放,用拾音設(shè)備進(jìn)行錄?。辉賹?duì)錄制的場(chǎng)景語(yǔ)音進(jìn)行標(biāo)注,通過(guò)基礎(chǔ)語(yǔ)音的標(biāo)注信息進(jìn)行場(chǎng)景錄制語(yǔ)音對(duì)齊,生成真實(shí)場(chǎng)景的場(chǎng)景標(biāo)注語(yǔ)音;最后采用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行場(chǎng)景語(yǔ)音自適應(yīng)訓(xùn)練,達(dá)到場(chǎng)景語(yǔ)音識(shí)別的要求。??