一種基于SE卷積網(wǎng)絡(luò)的樂器識別方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201910569242.5 申請日 -
公開(公告)號 CN110310666B 公開(公告)日 2021-07-23
申請公布號 CN110310666B 申請公布日 2021-07-23
分類號 G10L25/51(2013.01)I;G10L25/30(2013.01)I;G10L21/10(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 尹學(xué)淵;祁松茂;江天宇 申請(專利權(quán))人 成都潛在人工智能科技有限公司
代理機(jī)構(gòu) 成都睿道專利代理事務(wù)所(普通合伙) 代理人 賀理興
地址 610041四川省成都市高新區(qū)益州大道中段722號1棟1單元12層1210號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于SE卷積網(wǎng)絡(luò)的樂器識別方法及系統(tǒng),方法包括如下步驟:待識別數(shù)據(jù)預(yù)處理,將待識別音頻文件轉(zhuǎn)換為待識別自相關(guān)譜圖;待識別數(shù)據(jù)識別,將待識別自相關(guān)譜圖輸入預(yù)先構(gòu)建的樂器識別模型進(jìn)行識別,得到輸出結(jié)果矩陣;樂器解析,將樂器識別模型的輸出結(jié)果矩陣整合解析為自然語言表示的樂器標(biāo)簽。該方法將待識別音頻文件轉(zhuǎn)換為自相關(guān)譜圖,自相關(guān)譜圖采用自相關(guān)算法,能夠有效克服短時(shí)傅里葉變換的不足,利用預(yù)先構(gòu)建的樂器識別模型對自相關(guān)譜圖進(jìn)行處理,能夠識別出音頻數(shù)據(jù)所使用的樂器種類,對真實(shí)場景的復(fù)調(diào)音樂有著較高的識別率,且識別速度較快,可以極大地降低人工成本,節(jié)省時(shí)間,提升效率。