一種基于數(shù)據(jù)壓縮Apriori算法的關(guān)聯(lián)規(guī)則挖掘方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201110430528.9 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN103176976B | 公開(公告)日 | 2016-01-20 |
| 申請(qǐng)公布號(hào) | CN103176976B | 申請(qǐng)公布日 | 2016-01-20 |
| 分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 高海洋;沈強(qiáng);張軒溢;唐朝偉;趙志軍;慈松;唐暉 | 申請(qǐng)(專利權(quán))人 | 無錫中科智能信息處理研發(fā)中心有限公司 |
| 代理機(jī)構(gòu) | 北京法思騰知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 中國科學(xué)院聲學(xué)研究所;無錫中科智能信息處理研發(fā)中心有限公司 |
| 地址 | 100190 北京市海淀區(qū)北四環(huán)西路21號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種基于數(shù)據(jù)壓縮Apriori算法的關(guān)聯(lián)規(guī)則挖掘方法,包括步驟:判斷數(shù)據(jù)庫中的事物記錄條數(shù)N大于該數(shù)據(jù)庫中所有數(shù)據(jù)項(xiàng)的所有可能的組合數(shù)M時(shí),生成數(shù)據(jù)庫項(xiàng)與該數(shù)據(jù)項(xiàng)數(shù)量的映射表DB_Map_Table;將該映射表DB_Map_Table中的所有健值對(duì)<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)項(xiàng)候選集時(shí),判斷將要合并的兩個(gè)頻繁集中不同的項(xiàng)所組成的二項(xiàng)集是否為2項(xiàng)頻繁集的子集,如果是,則將將要合并的兩個(gè)頻繁集的合集加入候選集。本發(fā)明的效果在于,減小了原有事務(wù)數(shù)據(jù)庫的大小,減少了數(shù)據(jù)庫的掃描次數(shù),減少了算法運(yùn)行過程中候選集的生成,從而在保證算法正確的同時(shí)有效地提高了算法的速度和效率。 |





