一種特征提取和分類任務(wù)分離的數(shù)據(jù)不均衡處理方法

基本信息

申請(qǐng)?zhí)?/td> CN202110293696.1 申請(qǐng)日 -
公開(公告)號(hào) CN112966767B 公開(公告)日 2022-03-22
申請(qǐng)公布號(hào) CN112966767B 申請(qǐng)公布日 2022-03-22
分類號(hào) G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳志強(qiáng);呂晨 申請(qǐng)(專利權(quán))人 焦點(diǎn)科技股份有限公司
代理機(jī)構(gòu) 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙) 代理人 陳建和
地址 210032江蘇省南京市高新開發(fā)區(qū)星火路軟件大廈A座12F
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種特征提取和分類任務(wù)分離的數(shù)據(jù)不均衡處理方法,其特征在于,包括步驟一:準(zhǔn)備用于模型訓(xùn)練的分類數(shù)據(jù)集,判定數(shù)據(jù)是否存在長(zhǎng)尾分布;步驟二:利用深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練一個(gè)包含兩個(gè)分支網(wǎng)絡(luò)的模型,模型將表征特征與分類特征動(dòng)態(tài)融合,并進(jìn)行分類;步驟三:通過(guò)測(cè)試數(shù)據(jù)集對(duì)模型評(píng)估分析,在測(cè)試數(shù)據(jù)集上計(jì)算模型的準(zhǔn)確率和召回率,通過(guò)準(zhǔn)確率和召回率的值來(lái)判定模型的性能;步驟四:對(duì)驗(yàn)證測(cè)試好的模型進(jìn)行部署測(cè)試,在真實(shí)的場(chǎng)景中,對(duì)抓取的類別圖片進(jìn)行分析,統(tǒng)計(jì)分析分類的效果。達(dá)到在不改變?cè)紨?shù)據(jù)分布的情況下,很好的解決分類任務(wù)中長(zhǎng)尾分布的問(wèn)題的效果。