一種英語口音識(shí)別系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201811371012.X 申請(qǐng)日 -
公開(公告)號(hào) CN109493846B 公開(公告)日 2021-06-08
申請(qǐng)公布號(hào) CN109493846B 申請(qǐng)公布日 2021-06-08
分類號(hào) G10L15/00;G10L15/02;G10L15/04;G10L15/06;G10L15/16;G10L15/26 分類 樂器;聲學(xué);
發(fā)明人 鐘建生;楊智;高聰;蔣秋燕;李坤 申請(qǐng)(專利權(quán))人 深圳市聲希科技有限公司
代理機(jī)構(gòu) 深圳市正德知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 周善勇
地址 518000 廣東省深圳市寶安區(qū)新安街道興東社區(qū)留仙大道2號(hào)匯聚創(chuàng)新園1棟314A
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種英語口音識(shí)別系統(tǒng),包括如下步驟,S1:訓(xùn)練多任務(wù)多口音模型;S2:識(shí)別模塊對(duì)音頻做口音識(shí)別;步驟S1完成對(duì)口音模型數(shù)據(jù)庫(kù)的建立、模型目標(biāo)函數(shù)的建立,以及函數(shù)數(shù)據(jù)的后續(xù)處理;步驟S2完成對(duì)數(shù)據(jù)語音信息的處理,先完成單個(gè)文本單詞的處理,提取單詞的美式音素序列和英式音素序列,然后針對(duì)整段文本音頻進(jìn)行處理,獲取音頻特征,最后根據(jù)S1中的多任務(wù)多口音模型獲得音素的后驗(yàn)概率,求出每個(gè)單詞發(fā)音的概率,最后將概率轉(zhuǎn)化,進(jìn)一步求出整個(gè)文本英式/美式發(fā)音的概率;本發(fā)明能夠完成英文文本閱讀語音的英式、美式發(fā)音的檢測(cè),并通過概率的方式呈現(xiàn)出來,便于用戶了解,進(jìn)一步的改進(jìn)。