一種基于深度學習的音頻自動化標注方法

基本信息

申請?zhí)?/td> CN201810050808.9 申請日 -
公開(公告)號 CN108053836B 公開(公告)日 2021-03-23
申請公布號 CN108053836B 申請公布日 2021-03-23
分類號 G06F16/61(2019.01)I;G10L25/48(2013.01)I;G10L25/30(2013.01)I;G10L25/03(2013.01)I;G06F16/683(2019.01)I 分類 樂器;聲學;
發(fā)明人 尹學淵;江天宇 申請(專利權)人 成都嗨翻屋科技有限公司
代理機構 四川力久律師事務所 代理人 劉童笛
地址 610000四川省成都市中國(四川)自由貿(mào)易試驗區(qū)成都高新區(qū)益州大道中段722號1幢1單元12層1201號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種音頻標注方法,特別涉及一種基于深度學習的音頻自動化標注方法。一種基于深度學習的音頻自動化標注方法,包括以下實現(xiàn)步驟:輸入原始音頻文件,通過音頻預處理,得到若干個原始語譜圖片段;將所述原始語譜圖片段輸入卷積神經(jīng)網(wǎng)絡中進行訓練,構建深度學習模型;輸入待標注音頻文件,通過音頻預處理,得到若干個待標注語譜圖片段;基于所述深度學習模型,將所述待標注語譜圖片段進行音頻標注。本發(fā)明利用卷積神經(jīng)網(wǎng)絡訓練音頻深度學習網(wǎng)絡,實現(xiàn)音頻自動化標注方法,相比于傳統(tǒng)的人工標注方式,提高了標注準確率,提升了音頻標注效率。??