數(shù)據(jù)挖掘中基于密度的K中心點(diǎn)劃分聚類方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201510208624.7 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN104765879A | 公開(kāi)(公告)日 | 2015-07-08 |
| 申請(qǐng)公布號(hào) | CN104765879A | 申請(qǐng)公布日 | 2015-07-08 |
| 分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 袁啟龍;史海波;周曉鋒 | 申請(qǐng)(專利權(quán))人 | 無(wú)錫中科泛在信息技術(shù)研發(fā)中心有限公司 |
| 代理機(jī)構(gòu) | 無(wú)錫市大為專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 殷紅梅;張濤 |
| 地址 | 214135 江蘇省無(wú)錫市新區(qū)菱湖大道200號(hào)中國(guó)傳感網(wǎng)國(guó)際創(chuàng)新園C座 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種數(shù)據(jù)挖掘中基于密度的K中心點(diǎn)劃分聚類方法,其包括如下步驟:步驟1、給定所需的數(shù)據(jù)集,并確定聚類個(gè)數(shù)K;步驟2、計(jì)算數(shù)據(jù)對(duì)象的密度及平均密度;步驟3、計(jì)算數(shù)據(jù)集內(nèi)每個(gè)數(shù)據(jù)對(duì)象的最小密度距離值;步驟4、對(duì)數(shù)據(jù)集內(nèi)數(shù)據(jù)對(duì)象的最小密度距離值進(jìn)行降序排序,根據(jù)確定的聚類個(gè)數(shù)K,從大到小選擇K個(gè)與最小密度距離值對(duì)應(yīng)并且密度大于平均密度的數(shù)據(jù)對(duì)象作為聚類中心;步驟5、將數(shù)據(jù)集內(nèi)的數(shù)據(jù)對(duì)象分配到與所述數(shù)據(jù)對(duì)象距離最近的初始聚類中心,得到聚類結(jié)果。本發(fā)明能夠選出高質(zhì)量的中心點(diǎn),而不需要像K均值算法中的后續(xù)迭代更新步驟,其降低計(jì)算復(fù)雜度,提高分類的準(zhǔn)確率,穩(wěn)定性高,提高運(yùn)算效率。 |





