一種基于搜索行為的網(wǎng)絡(luò)熱點(diǎn)話題判定方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910707855.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112395480A 公開(kāi)(公告)日 2021-02-23
申請(qǐng)公布號(hào) CN112395480A 申請(qǐng)公布日 2021-02-23
分類(lèi)號(hào) G06F16/951(2019.01)I; 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 杜小軍;丁雨 申請(qǐng)(專(zhuān)利權(quán))人 北京中潤(rùn)普達(dá)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京律誠(chéng)同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 祁建國(guó);張燕華
地址 100029北京市西城區(qū)北三環(huán)中路甲29號(hào)院華尊大廈B座6層605
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于搜索行為自動(dòng)發(fā)現(xiàn)和判定網(wǎng)絡(luò)熱點(diǎn)話題的方法,包括:采用文本的聚類(lèi)方法、熱點(diǎn)發(fā)掘算法和分詞矩陣技術(shù)來(lái)實(shí)現(xiàn)熱點(diǎn)的發(fā)現(xiàn)。也就是當(dāng)一個(gè)類(lèi)的規(guī)模很大的時(shí)候,運(yùn)用文本的聚類(lèi)方法、熱點(diǎn)發(fā)掘算法和分詞矩陣技術(shù)就可以判定它是一個(gè)話題(Topic)。由于傳統(tǒng)的一些話題提取算法都是基于比較正式的文章或是比較專(zhuān)業(yè)的論文,而在這里我們需要針對(duì)網(wǎng)絡(luò)搜索行為的特點(diǎn)來(lái)實(shí)現(xiàn)熱點(diǎn)提取算法,這些搜索行為的特征體現(xiàn)為一些字詞或者關(guān)鍵詞匯。由于網(wǎng)絡(luò)上的話題存在相關(guān)性,因此將文本的聚類(lèi)方法、關(guān)聯(lián)關(guān)系算法和分詞矩陣技術(shù)引入到話題提取算法中,從而實(shí)現(xiàn)網(wǎng)絡(luò)熱點(diǎn)話題的自動(dòng)判斷和自主發(fā)現(xiàn)。??