一種有效語音識別方法及裝置

基本信息

申請?zhí)?/td> CN201710573521.X 申請日 -
公開(公告)號 CN107369449B 公開(公告)日 2019-11-26
申請公布號 CN107369449B 申請公布日 2019-11-26
分類號 G10L15/26;G10L21/0208;G10L21/0272;G06K9/00 分類 樂器;聲學;
發(fā)明人 蔣化冰;蔡漢嘉;廖凱;齊鵬舉;方園;米萬珠;舒劍;吳琨;管偉;羅璇 申請(專利權)人 諾亞機器人科技(上海)有限公司
代理機構 上海碩力知識產(chǎn)權代理事務所(普通合伙) 代理人 郭桂峰
地址 200335 上海市長寧區(qū)廣順路33號2幢402室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供一種有效語音識別的方法及裝置,所述方法包括:記錄聲源對象的語音數(shù)據(jù),同時獲取所述聲源對象的臉部圖像數(shù)據(jù);對所述語音數(shù)據(jù)進行ASR識別,獲得ASR識別結果,所述ASR識別結果包括若干條語音內容及對應的語音記錄時間點;對所述聲源對象的臉部圖像數(shù)據(jù)進行張口特征識別,獲得若干幀張口圖像和所述每幀張口圖像對應的圖像獲取時間點;以及,比對所述每條語音內容對應的語音記錄時間點的前后預設時間范圍內,是否有相應的張口圖像的圖像獲取時間點在此范圍內;若有,記錄對應的語音內容為有效語音。通過本方法及裝置,能夠從ASR識別結果中識別有效的語音數(shù)據(jù),有效提高ASR識別結果的應用價值。