一種數(shù)據(jù)處理方法及裝置、可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202011644826.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112734035A 公開(kāi)(公告)日 2021-04-30
申請(qǐng)公布號(hào) CN112734035A 申請(qǐng)公布日 2021-04-30
分類號(hào) G06N3/08;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張翼;顧華鑫;李辰;廖強(qiáng) 申請(qǐng)(專利權(quán))人 成都佳華物鏈云科技有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 張萌
地址 610000 四川省成都市天府新區(qū)華陽(yáng)街道華府大道一段1號(hào)1號(hào)樓23A樓06-08號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)處理方法及裝置、可讀存儲(chǔ)介質(zhì)。數(shù)據(jù)處理方法包括:獲取多張樣本圖片和預(yù)先訓(xùn)練好的多個(gè)驗(yàn)證模型;每張樣本圖片對(duì)應(yīng)一個(gè)標(biāo)注標(biāo)簽;將多張樣本圖片分別輸入到多個(gè)驗(yàn)證模型中,獲得每個(gè)驗(yàn)證模型輸出的驗(yàn)證結(jié)果;驗(yàn)證結(jié)果中包括:每張樣本圖片的標(biāo)簽為預(yù)設(shè)的多個(gè)標(biāo)簽中的每個(gè)標(biāo)簽的概率;多個(gè)標(biāo)簽不相同;標(biāo)注標(biāo)簽屬于多個(gè)標(biāo)簽中的標(biāo)簽;根據(jù)多個(gè)驗(yàn)證模型輸出的驗(yàn)證結(jié)果確定每張樣本圖片對(duì)應(yīng)的標(biāo)注標(biāo)簽與多個(gè)標(biāo)簽之間的平均交叉熵;根據(jù)多張樣本圖片的平均交叉熵確定多個(gè)標(biāo)簽的擬合分布;根據(jù)每張樣本圖片的平均交叉熵在擬合分布中的概率確定每張樣本圖片對(duì)應(yīng)的標(biāo)注標(biāo)簽是否為正確標(biāo)簽。該方法提高標(biāo)簽清洗的準(zhǔn)確度和效率。