一種基于數(shù)據(jù)去重的分布式數(shù)據(jù)挖掘與統(tǒng)計(jì)方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201911106504.0 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN111061559A | 公開(公告)日 | 2020-04-24 |
| 申請(qǐng)公布號(hào) | CN111061559A | 申請(qǐng)公布日 | 2020-04-24 |
| 分類號(hào) | G06F9/50;H04L29/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 鄧金祥;王煒;代先勇;谷峰;曾海剛;佘朝裕;劉洋 | 申請(qǐng)(專利權(quán))人 | 成都安思科技有限公司 |
| 代理機(jī)構(gòu) | 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 葉明博 |
| 地址 | 610041 四川省成都市高新區(qū)天府大道北段1700號(hào)7棟1單元21樓2121號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種基于數(shù)據(jù)去重的分布式數(shù)據(jù)挖掘與統(tǒng)計(jì)方法,分布式服務(wù)器集群遍歷數(shù)據(jù)包所有數(shù)據(jù),并根據(jù)用戶配置的數(shù)據(jù)聚合挖掘條件,分布式服務(wù)器集群中各個(gè)服務(wù)器節(jié)點(diǎn)分別判斷數(shù)據(jù)是否重復(fù),若不重復(fù)則保留,否則刪除重復(fù)多余的數(shù)據(jù)。本發(fā)明通過(guò)分布式處理原始數(shù)據(jù),從而大大的降低數(shù)據(jù)包的數(shù)量級(jí)別,大大降低了用戶配置復(fù)雜挖掘條件的難度,強(qiáng)化了數(shù)據(jù)挖掘的針對(duì)性,大幅提升了數(shù)據(jù)挖掘的效率。 |





