口語發(fā)音質(zhì)量評價方法、裝置、設(shè)備及存儲介質(zhì)
基本信息

| 申請?zhí)?/td> | CN202011480460.0 | 申請日 | - |
| 公開(公告)號 | CN112700795A | 公開(公告)日 | 2021-04-23 |
| 申請公布號 | CN112700795A | 申請公布日 | 2021-04-23 |
| 分類號 | G10L25/60;G10L25/30 | 分類 | 樂器;聲學; |
| 發(fā)明人 | 蔣國雷;李坤;劉鵬飛;廖春紅 | 申請(專利權(quán))人 | 深圳市聲??萍加邢薰?/a> |
| 代理機構(gòu) | 深圳市恒程創(chuàng)新知識產(chǎn)權(quán)代理有限公司 | 代理人 | 劉冰 |
| 地址 | 518000 廣東省深圳市新安街道興東社區(qū)留仙大道2號匯聚創(chuàng)新園2棟2710 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明屬于語音識別技術(shù)領(lǐng)域,公開了一種口語發(fā)音質(zhì)量評價方法、裝置、設(shè)備及存儲介質(zhì)。該方法包括:獲取待測試人員的多條句子級語音信號;根據(jù)所述句子級語音信號確定一一對應(yīng)的句子級后驗概率分布分數(shù);將所述句子級后驗概率分布分數(shù)通過訓練好的預(yù)設(shè)質(zhì)量評價神經(jīng)網(wǎng)絡(luò)進行質(zhì)量評價,得到所述待測試人員的口語發(fā)音質(zhì)量評價結(jié)果。通過上述方式,根據(jù)說話人的多條句子級語音信號確定句子級后驗概率分布分數(shù),多條句子級后驗概率分布分數(shù)作為說話人級別的特征,包含說話人發(fā)音的詳細信息以及發(fā)音優(yōu)度,更具有解釋性,引用訓練好的預(yù)設(shè)質(zhì)量評價神經(jīng)網(wǎng)絡(luò)對多條句子級后驗概率分布分數(shù)進行質(zhì)量評價,提高了口音分類的精度以及穩(wěn)定性。 |





