異常數(shù)據(jù)檢測方法和裝置

基本信息

申請?zhí)?/td> CN201710145015.0 申請日 -
公開(公告)號 CN107122394B 公開(公告)日 2020-02-14
申請公布號 CN107122394B 申請公布日 2020-02-14
分類號 G06F16/35;G06N5/02 分類 計算;推算;計數(shù);
發(fā)明人 李剛毅;趙小光;于坤元;劉剛 申請(專利權(quán))人 博彥科技股份有限公司
代理機構(gòu) 北京康信知識產(chǎn)權(quán)代理有限責任公司 代理人 韓建偉;張永明
地址 100193 北京市海淀區(qū)西北旺東路10號院東區(qū)7號樓(博彥科技大廈)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種異常數(shù)據(jù)檢測方法和裝置。其中,該方法包括:獲取文本;從所述文本中提取多條數(shù)據(jù),其中,所述多條數(shù)據(jù)中的每一條數(shù)據(jù)均由多個屬性值構(gòu)成,每個屬性值對應(yīng)該數(shù)據(jù)的一個屬性,所述每一條數(shù)據(jù)的屬性均相同;對所述每一條數(shù)據(jù)的屬性值進行匯合得到所述每一條數(shù)據(jù)的新屬性值,其中,所述每一條數(shù)據(jù)的新屬性值的個數(shù)小于匯合之前的所述每一條數(shù)據(jù)的屬性值的個數(shù);使用所述每一條數(shù)據(jù)的新屬性值進行機器學(xué)習得到數(shù)據(jù)模型,其中,所述數(shù)據(jù)模型用于區(qū)分從文本中提取的數(shù)據(jù)是否為異常數(shù)據(jù)。通過本發(fā)明解決了現(xiàn)有技術(shù)中所存在的用于培訓(xùn)的數(shù)據(jù)維度大導(dǎo)致的問題,提高培訓(xùn)效率的同時提高了培訓(xùn)結(jié)果的準確度。