數(shù)據(jù)抽樣方法、裝置、存儲介質(zhì)和處理器

基本信息

申請?zhí)?/td> CN201910599090.3 申請日 -
公開(公告)號 CN110399413A 公開(公告)日 2019-11-01
申請公布號 CN110399413A 申請公布日 2019-11-01
分類號 G06F16/25(2019.01)I; G06F16/27(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李瑋巍; 吳明璞; 李剛毅 申請(專利權(quán))人 博彥科技股份有限公司
代理機(jī)構(gòu) 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 董文倩
地址 100193 北京市海淀區(qū)西北旺東路10號院東區(qū)7號樓(博彥科技大廈)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種數(shù)據(jù)抽樣方法、裝置、存儲介質(zhì)和處理器。其中,該方法包括:獲取分布式存儲系統(tǒng)中的數(shù)據(jù)分布信息,其中,分布式存儲系統(tǒng)包括多個(gè)存儲分區(qū),數(shù)據(jù)分布信息用于表示每個(gè)存儲分區(qū)的數(shù)據(jù)分布情況;根據(jù)數(shù)據(jù)分布信息,確定每個(gè)存儲分區(qū)對應(yīng)的抽樣條件,其中,抽樣條件包括如下至少之一:抽樣比例、抽樣數(shù)量;按照抽樣條件對存儲分區(qū)進(jìn)行數(shù)據(jù)抽樣,得到抽樣結(jié)果。本發(fā)明解決了基于分布式存儲系統(tǒng)進(jìn)行數(shù)據(jù)抽樣的效率較低的技術(shù)問題。