一種基于分布式大數(shù)據(jù)計(jì)算平臺的數(shù)據(jù)質(zhì)檢方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202111194653.4 申請日 -
公開(公告)號 CN114004465A 公開(公告)日 2022-02-01
申請公布號 CN114004465A 申請公布日 2022-02-01
分類號 G06Q10/06(2012.01)I;G06Q10/10(2012.01)I;G06Q50/26(2012.01)I;G06F16/22(2019.01)I;G06F16/27(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 左小龍 申請(專利權(quán))人 數(shù)字鄭州科技有限公司
代理機(jī)構(gòu) 鄭州睿信知識產(chǎn)權(quán)代理有限公司 代理人 吳敏
地址 450000河南省鄭州市鄭東新區(qū)中道東路6號創(chuàng)意島大廈C區(qū)C-4-029房間
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于分布式大數(shù)據(jù)計(jì)算平臺的數(shù)據(jù)質(zhì)檢方法及系統(tǒng),屬于數(shù)據(jù)處理技術(shù)領(lǐng)域。本發(fā)明采用增量抽取方式獲取當(dāng)日新增或者重新上報(bào)的辦件數(shù)據(jù),并將獲取的新增或者重新上報(bào)的辦件數(shù)據(jù)與平臺中存儲的歷史辦件數(shù)據(jù)進(jìn)行關(guān)聯(lián)和合并,得到更新后的辦件數(shù)據(jù),對更新后的辦件數(shù)據(jù)進(jìn)行質(zhì)檢。整個(gè)過程不受上報(bào)時(shí)間和數(shù)據(jù)量的限制,能夠多次上報(bào)和歷史數(shù)據(jù)批量上報(bào),當(dāng)數(shù)據(jù)完全沒有變更的情況會被過濾無需重新上報(bào),減少上報(bào)壓力,極大提高了質(zhì)檢的運(yùn)行效率和計(jì)算能力,解決了目前向省級上報(bào)的辦件數(shù)據(jù)合格率低、時(shí)效性差的問題。