一種基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法

基本信息

申請(qǐng)?zhí)?/td> CN202110777271.8 申請(qǐng)日 -
公開(公告)號(hào) CN113505156A 公開(公告)日 2021-10-15
申請(qǐng)公布號(hào) CN113505156A 申請(qǐng)公布日 2021-10-15
分類號(hào) G06F16/2458(2019.01)I;G06F16/242(2019.01)I;G06F16/2453(2019.01)I;G06F16/215(2019.01)I;G06F16/22(2019.01)I;G06Q30/02(2012.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 何新;王子龍;陳琛 申請(qǐng)(專利權(quán))人 南京榮新智能科技有限公司
代理機(jī)構(gòu) 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李興林
地址 210000江蘇省南京市秦淮區(qū)光華路162號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法,包括步驟:對(duì)商品交易數(shù)據(jù)進(jìn)行預(yù)處理,得到商品交易數(shù)據(jù)集,并存入交易序列數(shù)據(jù)庫(kù)中;掃描交易序列數(shù)據(jù)庫(kù),對(duì)每個(gè)單項(xiàng)進(jìn)行計(jì)數(shù),得到每個(gè)單項(xiàng)的序列支持度并降序排列,選出前μ項(xiàng)且滿足最小支持度的單項(xiàng)作為初始前綴;采取深度優(yōu)先遍歷,對(duì)第一個(gè)初始前綴的位置進(jìn)行計(jì)算,并保存在前綴位置信息表中,生成商品交易投影數(shù)據(jù)庫(kù);再對(duì)其進(jìn)行迭代,直至無法生成新的商品交易投影數(shù)據(jù)庫(kù),保存每個(gè)商品交易投影數(shù)據(jù)庫(kù)生成的頻繁序列模式集合;從第二個(gè)初始前綴開始,重復(fù)上一步驟,直至所有初始前綴均計(jì)算完畢。本發(fā)明用于減少交易數(shù)據(jù)頻繁序列模式挖掘的時(shí)間/空間消耗,提高執(zhí)行效率。