語音語料庫的構建方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201310116396.1 申請日 -
公開(公告)號 CN103198828B 公開(公告)日 2015-09-23
申請公布號 CN103198828B 申請公布日 2015-09-23
分類號 G10L15/06(2013.01)I;G10L15/30(2013.01)I 分類 樂器;聲學;
發(fā)明人 江南;陳德全 申請(專利權)人 中金數(shù)據集團有限公司
代理機構 北京三聚陽光知識產權代理有限公司 代理人 寇海俠
地址 100176 北京市大興區(qū)北京經濟技術開發(fā)區(qū)博興八路1號
法律狀態(tài) -

摘要

摘要 本發(fā)明的語音語料庫的構建方法和系統(tǒng),通過語音錄入客戶端實現(xiàn)語音語料的采集,進而通過網絡傳輸給服務器,使得語音語料的采集可以隨時隨地進行,無需專門的錄音棚和專門的錄音設備,借用現(xiàn)有的網絡即可實現(xiàn),語音語料的獲取成本大大降低;同時,語音語料是用于后續(xù)語音識別的,識別的語音均在平時的生活環(huán)境中生成,要識別的錄音自然會有周圍環(huán)境的噪音,如果語音語料僅在錄音棚中生成,反而脫離了實際生活,不利于實際生活場景中語音的識別。本發(fā)明的語音語料庫的構建方法和系統(tǒng),在減少成本的基礎上,更使得語音語料更接近實際場景中的語音,提高實際場景中語音的識別率。