一種基于網(wǎng)絡(luò)行為數(shù)據(jù)的聚類分析方法

基本信息

申請(qǐng)?zhí)?/td> CN202210323358.2 申請(qǐng)日 -
公開(公告)號(hào) CN114707593A 公開(公告)日 2022-07-05
申請(qǐng)公布號(hào) CN114707593A 申請(qǐng)公布日 2022-07-05
分類號(hào) G06K9/62(2022.01)I;H04L9/40(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄧金祥;周恩亞;馮園園;周瑞;孫超;王明凱;謝之 申請(qǐng)(專利權(quán))人 成都鋒衛(wèi)科技有限公司
代理機(jī)構(gòu) 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 610041四川省成都市高新區(qū)天府大道北段1700號(hào)7棟1單元21樓2119號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于網(wǎng)絡(luò)行為數(shù)據(jù)的聚類分析方法,涉及數(shù)據(jù)分析領(lǐng)域,包括S1獲取待處理的數(shù)據(jù)集,數(shù)據(jù)集包括至少一條行為線索;S2每一條行為線索均與已有組織的線索集進(jìn)行匹配,將匹配成功的行為線索加入線索集,未匹配成功的行為線索加入緩存,并進(jìn)入S3;S3分析未匹配成功的行為線索,聚類形成多個(gè)中心區(qū)域;S4計(jì)算每兩個(gè)中心區(qū)域的相似度,合并相似度超過閾值的兩個(gè)中心區(qū)域形成新的中心區(qū)域;S5判斷每個(gè)中心區(qū)域是否滿足成為一個(gè)組織的條件,若滿足則將該中心區(qū)域移出緩存建立為新的線索集,并將其進(jìn)行持久化存儲(chǔ);反之則繼續(xù)保留在緩存中,并持久化緩存;對(duì)網(wǎng)絡(luò)行為進(jìn)行聚類分析,可以快速、相對(duì)實(shí)時(shí)的對(duì)互聯(lián)網(wǎng)的行為進(jìn)行溯源。