基于大數(shù)據(jù)的信息數(shù)據(jù)存儲(chǔ)整合系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN202011008763.2 申請日 -
公開(公告)號(hào) CN112100469A 公開(公告)日 2020-12-18
申請公布號(hào) CN112100469A 申請公布日 2020-12-18
分類號(hào) G06F16/93;G06F40/194 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 潘倩雯 申請(專利權(quán))人 云寶寶大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限責(zé)任公司
代理機(jī)構(gòu) 北京華際知識(shí)產(chǎn)權(quán)代理有限公司 代理人 黃永蘭
地址 215000 江蘇省蘇州市高新區(qū)鴻禧路471號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于大數(shù)據(jù)的信息數(shù)據(jù)存儲(chǔ)整合系統(tǒng)及方法,所述整合系統(tǒng)包括文檔信息獲取模塊、文檔選取模塊和拆分合并處理模塊,所述文檔信息獲取模塊用于獲取上一個(gè)周期內(nèi)待處理文件夾中各個(gè)待合并文檔的文檔信息,所述文檔信息包括文檔名稱和最后修改時(shí)間,所述文檔選取模塊從待合并文檔中選出疑似相近文檔,再從疑似相近文檔中篩選出相近文檔,所述拆分合并處理模塊對(duì)相近文檔進(jìn)行拆分合并處理。