一種基于數(shù)據(jù)平臺的數(shù)據(jù)控制方法

基本信息

申請?zhí)?/td> CN201310037541.7 申請日 -
公開(公告)號 CN103136335B 公開(公告)日 2016-06-29
申請公布號 CN103136335B 申請公布日 2016-06-29
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 蘇萌;柏林森;張韶峰;陳浪仙;龔亮;李渭民 申請(專利權(quán))人 北京千分點信息科技有限公司
代理機構(gòu) 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 代理人 北京百分點信息科技有限公司
地址 100101 北京市海淀區(qū)北四環(huán)西路66號中國技術交易大廈A座15層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于數(shù)據(jù)平臺的數(shù)據(jù)控制方法,包括:獲取多個數(shù)據(jù)平臺的數(shù)據(jù)并整合,整合后的數(shù)據(jù)包括數(shù)據(jù)平臺的用戶數(shù)據(jù)及數(shù)據(jù)項的原始數(shù)據(jù),且整合后的數(shù)據(jù)包括對用戶行為的多維度描述以及對數(shù)據(jù)項的多維度描述,并包含線上和線下的數(shù)據(jù);對整合后的數(shù)據(jù)采用分布式處理框架的方式處理并進行歸一化、規(guī)范化和數(shù)據(jù)清洗操作,歸一化操作是指對數(shù)值數(shù)據(jù)進行歸一化操作;規(guī)范化操作是指將數(shù)據(jù)結(jié)構(gòu)化地組織,保持數(shù)據(jù)完整性并減少冗余,增進數(shù)據(jù)的一致性;數(shù)據(jù)清洗操作是指針對不完整數(shù)據(jù)、錯誤數(shù)據(jù)、重復數(shù)據(jù)進行數(shù)據(jù)清洗;提取處理后的數(shù)據(jù)并展示。本發(fā)明通過新的數(shù)據(jù)控制方式提高了數(shù)據(jù)搜索的速度。