一種基于選擇性集成分類器的數據打標簽方法

基本信息

申請?zhí)?/td> CN201710171617.3 申請日 -
公開(公告)號 CN107133258A 公開(公告)日 2017-09-05
申請公布號 CN107133258A 申請公布日 2017-09-05
分類號 G06F17/30(2006.01)I;G06F17/27(2006.01)I 分類 計算;推算;計數;
發(fā)明人 楊旭川;張桂林 申請(專利權)人 重慶允升科技有限公司
代理機構 重慶創(chuàng)新專利商標代理有限公司 代理人 重慶允升科技有限公司
地址 401120 重慶市渝北區(qū)北部新區(qū)金渝大道68號4棟第25-3
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于選擇性集成分類器的數據打標簽方法,包括以下步驟:1)生成數據訓練集;2)文本預處理;3)文本向量化:將文本轉化為向量的代數建模過程;4)利用布爾矩陣存儲集成分類器對預處理的文本進行分類;5)從布爾矩陣中篩選出分類性能較好的基分類器構成最終的集成分類器;6)建立標簽庫:建立每個分類與標簽的映射關系;7)接收到選擇性集成分類器返回的分類結果,根據分類結果獲取分類的標簽。本發(fā)明可提高標簽的準確度,并減小集成系統的規(guī)模。