一種基于深度學(xué)習(xí)算法的企業(yè)行業(yè)二級行業(yè)多標(biāo)簽分類器

基本信息

申請?zhí)?/td> CN202110491360.6 申請日 -
公開(公告)號 CN113407644A 公開(公告)日 2021-09-17
申請公布號 CN113407644A 申請公布日 2021-09-17
分類號 G06F16/28(2019.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳鵬;王樹志;梁正堯;馬金河 申請(專利權(quán))人 國科元科技(北京)有限公司
代理機構(gòu) 深圳市圳博友邦專利代理事務(wù)所(普通合伙) 代理人 陳烈軍
地址 100089北京市海淀區(qū)中關(guān)村北二條13號7幢4層402房間
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)算法的企業(yè)行業(yè)二級行業(yè)多標(biāo)簽分類器,由采集模塊、預(yù)處理模塊、管理模塊、模型建立模塊、訓(xùn)練驗證模塊、輸入模塊、顯示模塊組成,其中:采集模塊用于采集企業(yè)經(jīng)營范圍信息;預(yù)處理模塊用于對企業(yè)經(jīng)營范圍信息進行預(yù)處理;管理模塊用于對企業(yè)經(jīng)營范圍信息進行人工標(biāo)引,并制作用于多標(biāo)簽分類訓(xùn)練的訓(xùn)練集、驗證集和測試集;模型建立模塊用于使用訓(xùn)練集建立Albert+TextCNN模型;訓(xùn)練驗證模塊用于對建立的Albert+TextCNN模型進行訓(xùn)練,并驗證正確率;本發(fā)明的有益效果是:實現(xiàn)了對企業(yè)二級行業(yè)的多標(biāo)簽分類,并改進了現(xiàn)有方法所需訓(xùn)練時間過長的問題;模塊化設(shè)計,也可以進行單標(biāo)簽分類,并且準確率較現(xiàn)有方法相比具有很大的提高。