一種數(shù)據(jù)篩選的方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201410667074.0 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN104376089B | 公開(kāi)(公告)日 | 2018-03-27 |
| 申請(qǐng)公布號(hào) | CN104376089B | 申請(qǐng)公布日 | 2018-03-27 |
| 分類(lèi)號(hào) | G06F17/30 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 江潮;賀建華;張光凌 | 申請(qǐng)(專(zhuān)利權(quán))人 | 八方傳神數(shù)碼科技(武漢)有限公司 |
| 代理機(jī)構(gòu) | 北京康盛知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 語(yǔ)聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司 |
| 地址 | 430070 湖北省武漢市東湖開(kāi)發(fā)區(qū)光谷軟件園一期以西、南湖南路以南、光谷軟件園六期2幢5層205號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了一種數(shù)據(jù)篩選的方法,包括:從第一數(shù)據(jù)項(xiàng)的第一內(nèi)容中篩選多個(gè)第一關(guān)鍵詞,所述第一數(shù)據(jù)項(xiàng)為多個(gè)數(shù)據(jù)項(xiàng)中的一個(gè);將篩選的第一關(guān)鍵詞與所述多個(gè)數(shù)據(jù)項(xiàng)的第一內(nèi)容逐個(gè)進(jìn)行首次匹配,根據(jù)匹配結(jié)果將所述多個(gè)數(shù)據(jù)項(xiàng)分成匹配程度高和低的兩部分;從第一數(shù)據(jù)項(xiàng)的第二內(nèi)容中篩選多個(gè)第二關(guān)鍵詞,將篩選的第二關(guān)鍵詞與所述匹配程度低的數(shù)據(jù)項(xiàng)的第二內(nèi)容逐個(gè)進(jìn)行匹配,根據(jù)匹配結(jié)果將所述匹配程度低的數(shù)據(jù)項(xiàng)的多個(gè)數(shù)據(jù)項(xiàng)分成兩部分;其中,所述第一內(nèi)容的數(shù)據(jù)量小于第二內(nèi)容的數(shù)據(jù)量;將兩次匹配后,各次匹配度高的多個(gè)數(shù)據(jù)項(xiàng)的作為一個(gè)集合,并對(duì)集合內(nèi)的數(shù)據(jù)項(xiàng)聚類(lèi)分析。本發(fā)明提高了定位關(guān)注度高的作為網(wǎng)絡(luò)事件的數(shù)據(jù)項(xiàng)的速度。 |





