數(shù)據(jù)管理系統(tǒng)后臺(tái)自動(dòng)計(jì)算引擎的設(shè)計(jì)

基本信息

申請(qǐng)?zhí)?/td> CN202110680049.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113505106A 公開(kāi)(公告)日 2021-10-15
申請(qǐng)公布號(hào) CN113505106A 申請(qǐng)公布日 2021-10-15
分類(lèi)號(hào) G06F16/172(2019.01)I;G06F16/182(2019.01)I;G06F16/25(2019.01)I;G06F16/27(2019.01)I;G06F16/28(2019.01)I;G06F16/242(2019.01)I;G06F9/48(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉春華;向程;周華;陳華殷;王曉棟 申請(qǐng)(專(zhuān)利權(quán))人 深圳弘星智聯(lián)科技有限公司
代理機(jī)構(gòu) 北京中仟知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 周慶佳
地址 518000廣東省深圳市龍崗區(qū)寶龍街道寶龍社區(qū)寶龍二路4號(hào)思達(dá)工業(yè)園辦公樓208
法律狀態(tài) -

摘要

摘要 本發(fā)明提供數(shù)據(jù)管理系統(tǒng)后臺(tái)自動(dòng)計(jì)算引擎的設(shè)計(jì),涉及MDM后臺(tái)計(jì)算引擎領(lǐng)域。該MDM后臺(tái)自動(dòng)計(jì)算引擎的設(shè)計(jì),采用spark與hadoop分布式架構(gòu)相結(jié)合的技術(shù)來(lái)處理大規(guī)模的數(shù)據(jù)計(jì)算,包括如下具體實(shí)施步驟:生產(chǎn)數(shù)據(jù)的一方往kafka內(nèi)生產(chǎn)數(shù)據(jù);離線架構(gòu)采用flume去采集kafka中的數(shù)據(jù)到hdfs中;實(shí)時(shí)架構(gòu)采用sparkstreaming消費(fèi)kafka中的數(shù)據(jù),對(duì)原始數(shù)據(jù)進(jìn)行格式化處理,將數(shù)據(jù)寫(xiě)入到hbase中;編寫(xiě)sql腳本把hdfs中的原始數(shù)據(jù)進(jìn)行格式化處理,最后采用snappy壓縮寫(xiě)入離線數(shù)倉(cāng)hive中;對(duì)格式化的數(shù)據(jù)進(jìn)行分析處理,然后將最終的結(jié)果寫(xiě)入到hbase內(nèi),供前臺(tái)的業(yè)務(wù)系統(tǒng)調(diào)用。本發(fā)明相比之前的MDM系統(tǒng),如今就算數(shù)據(jù)量再大,只需要增加服務(wù)器即可解決數(shù)據(jù)存儲(chǔ)不下的問(wèn)題,同時(shí)可以實(shí)現(xiàn)多路徑寫(xiě)入數(shù)據(jù),使得用戶體驗(yàn)更好。