一種數(shù)據(jù)可回溯的大規(guī)模離散型特征挖掘的方法

基本信息

申請?zhí)?/td> CN201810120373.0 申請日 -
公開(公告)號 CN108287913A 公開(公告)日 2018-07-17
申請公布號 CN108287913A 申請公布日 2018-07-17
分類號 G06F17/30;G06Q40/02 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 郭安 申請(專利權(quán))人 霍爾果斯智融未來信息科技有限公司
代理機(jī)構(gòu) 北京華識知識產(chǎn)權(quán)代理有限公司 代理人 李浩
地址 835000 新疆維吾爾自治區(qū)伊犁哈薩克自治州霍爾果斯經(jīng)濟(jì)開發(fā)區(qū)兵團(tuán)分區(qū)開元路1號創(chuàng)新創(chuàng)業(yè)園孵化樓B-413-19室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種數(shù)據(jù)可回溯的大規(guī)模離散型特征挖掘的方法,線上請求和線下調(diào)研使用相同的特征計(jì)算lib,線上特征計(jì)算使用的原始數(shù)據(jù)快照通過緩存進(jìn)行全量保存,保障線下調(diào)研使用的數(shù)據(jù)和當(dāng)時(shí)線上使用的數(shù)據(jù)一致,當(dāng)特征挖掘有新的想法,需要從之前的數(shù)據(jù)中挖掘新的特征,只需更新特征計(jì)算lib,按照大規(guī)模離散型特征挖掘架構(gòu),利用更多的數(shù)據(jù)樣本制作模型。本發(fā)明可以保障在線、離線特征挖掘使用數(shù)據(jù)的一致性,模型生產(chǎn)不依賴于線上特征,離線調(diào)研完成即可上線,模型生產(chǎn)效率高,離線數(shù)據(jù)同步機(jī)制統(tǒng)一,開發(fā)維護(hù)成本低。