一種閩南語(yǔ)語(yǔ)音識(shí)別方法、系統(tǒng)、設(shè)備及介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110615995.2 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113571045A | 公開(kāi)(公告)日 | 2021-10-29 |
| 申請(qǐng)公布號(hào) | CN113571045A | 申請(qǐng)公布日 | 2021-10-29 |
| 分類(lèi)號(hào) | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/00(2013.01)I;G10L25/27(2013.01)I | 分類(lèi) | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 歐智堅(jiān);劉巖;肖吉;孫磊 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京它思智能科技有限公司 |
| 代理機(jī)構(gòu) | 北京動(dòng)力號(hào)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 董鋼 |
| 地址 | 100089北京市海淀區(qū)王莊路1號(hào)院清華同方科技大廈D座21層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種閩南語(yǔ)語(yǔ)音識(shí)別方法、系統(tǒng)、設(shè)備及介質(zhì),使用普通話音素作為建模單元對(duì)閩南語(yǔ)進(jìn)行識(shí)別,相較于傳統(tǒng)的使用閩南語(yǔ)音素作為建模單元,大幅減少了音素序列的數(shù)量,降低了基于音素的n?gram語(yǔ)言模型的復(fù)雜度,降低了工作量,從而提高了建模效率;同時(shí),在目標(biāo)函數(shù)中引入條件隨機(jī)場(chǎng)CRF,CTC的狀態(tài)后驗(yàn)可以看作是條件隨機(jī)場(chǎng)的點(diǎn)勢(shì)能,狀態(tài)與狀態(tài)之間的聯(lián)系可以通過(guò)邊勢(shì)能引入,改善了詞錯(cuò)誤率水平,提高了聲學(xué)模型的性能,從而提高了識(shí)別準(zhǔn)確率。 |





