基于知識(shí)蒸餾和多模態(tài)結(jié)合的質(zhì)檢方法

基本信息

申請(qǐng)?zhí)?/td> CN202111248179.9 申請(qǐng)日 -
公開(公告)號(hào) CN113919369A 公開(公告)日 2022-01-11
申請(qǐng)公布號(hào) CN113919369A 申請(qǐng)公布日 2022-01-11
分類號(hào) G06F40/35(2020.01)I;G10L15/06(2013.01)I;G06V10/764(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 操玉琴;宣明輝;張姍;周鴻章 申請(qǐng)(專利權(quán))人 信雅達(dá)科技股份有限公司
代理機(jī)構(gòu) 杭州裕陽聯(lián)合專利代理有限公司 代理人 葛婷婕
地址 310051浙江省杭州市濱江區(qū)江南大道3888號(hào)信雅達(dá)科技大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于知識(shí)蒸餾和多模態(tài)結(jié)合的質(zhì)檢方法,包含:搭建質(zhì)檢音頻模型并對(duì)其進(jìn)行訓(xùn)練;搭建質(zhì)檢文本模型并對(duì)其進(jìn)行訓(xùn)練;將音頻數(shù)據(jù)輸入訓(xùn)練好的質(zhì)檢音頻模型進(jìn)行學(xué)習(xí)得到音頻特征向量;將文本數(shù)據(jù)輸入訓(xùn)練好的質(zhì)檢文本模型進(jìn)行學(xué)習(xí)得到文本特征向量;將音頻特征向量和文本特征向量融合形成新的融合特征向量;根據(jù)融合特征向量進(jìn)行情緒預(yù)測。本發(fā)明的基于知識(shí)蒸餾和多模態(tài)結(jié)合的質(zhì)檢方法,利用教師模型結(jié)合數(shù)據(jù)增強(qiáng)的方法對(duì)學(xué)生模型進(jìn)行預(yù)訓(xùn)練引導(dǎo),利用網(wǎng)絡(luò)參數(shù)共享提升學(xué)生模型的復(fù)雜性,最后使用交叉熵?fù)p失函數(shù)聯(lián)合軟、硬標(biāo)簽對(duì)學(xué)生模型進(jìn)行訓(xùn)練得到音頻模型和文本模型,然后將兩模型特征融合預(yù)測最后的質(zhì)檢情緒分類結(jié)果。