一種實現(xiàn)混合數(shù)據(jù)分析的大數(shù)據(jù)處理方法
基本信息

| 申請?zhí)?/td> | CN202110598362.5 | 申請日 | - |
| 公開(公告)號 | CN113342790A | 公開(公告)日 | 2021-09-03 |
| 申請公布號 | CN113342790A | 申請公布日 | 2021-09-03 |
| 分類號 | G06F16/215(2019.01)I;G06F16/26(2019.01)I;G06F16/27(2019.01)I;G06F16/904(2019.01)I;G06F16/906(2019.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 駱嘯宇;鄭理 | 申請(專利權(quán))人 | 重慶大數(shù)據(jù)人工智能創(chuàng)新中心有限公司 |
| 代理機構(gòu) | 北京挺立專利事務(wù)所(普通合伙) | 代理人 | 賈楠楠 |
| 地址 | 400052重慶市九龍坡區(qū)西彭鎮(zhèn)西竹路2棟33號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種實現(xiàn)混合數(shù)據(jù)分析的大數(shù)據(jù)處理方法,通過在數(shù)據(jù)預(yù)處理單元中設(shè)置數(shù)據(jù)清洗模塊,數(shù)據(jù)清洗模塊又包括遺漏數(shù)據(jù)處理、噪聲數(shù)據(jù)處理和不一致數(shù)據(jù)處理三個不同子模塊,遺漏數(shù)據(jù)處理子模塊基于同類別均值進行遺漏值填補,噪聲數(shù)據(jù)處理子模塊可通過聚類分析方法幫助發(fā)現(xiàn)異常數(shù)據(jù),不一致數(shù)據(jù)處理子模塊能夠自動查出數(shù)據(jù)庫中岀現(xiàn)記錄內(nèi)容不一致的數(shù)據(jù),通過上述數(shù)據(jù)清洗預(yù)處理,能夠?qū)⒒旌蠑?shù)據(jù)中的大多數(shù)異常數(shù)據(jù)清洗掉,從而為后續(xù)大數(shù)據(jù)處理和分析數(shù)據(jù)內(nèi)容提供可靠數(shù)據(jù)來源,提高數(shù)據(jù)處理的準(zhǔn)確度,提高用戶使用體驗以及為企業(yè)經(jīng)營決策提供更準(zhǔn)確和更可靠的參照信息。 |





