基于詞性組合的新聞熱點提取方法、系統(tǒng)及存儲介質(zhì)
基本信息

| 申請?zhí)?/td> | CN201910120240.8 | 申請日 | - |
| 公開(公告)號 | CN109977397A | 公開(公告)日 | 2019-07-05 |
| 申請公布號 | CN109977397A | 申請公布日 | 2019-07-05 |
| 分類號 | G06F17/27(2006.01)I; G06K9/62(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 羅嘉惠; 白云龍; 唐昊; 魏延峰 | 申請(專利權(quán))人 | 廣州市誠毅科技軟件開發(fā)有限公司 |
| 代理機構(gòu) | 廣州嘉權(quán)專利商標事務(wù)所有限公司 | 代理人 | 胡輝 |
| 地址 | 510300 廣東省廣州市廣州大道南368號26樓 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了基于詞性組合的新聞熱點提取方法、系統(tǒng)及存儲介質(zhì),方法包括:對新聞標題集進行第一分詞處理,生成第一詞集;根據(jù)第一詞集對新聞標題集進行第一文本匹配,生成目標標題集;對目標標題集進行第二分詞處理,生成第二詞集;將第一詞集中的每個名詞進行兩兩對比,并將第一詞集中每個名詞對應(yīng)的第二詞集中的非名詞詞性的詞語序列進行兩兩對比,生成第一關(guān)鍵詞單元集;對第一關(guān)鍵詞單元集進行聚類處理,生成第二關(guān)鍵詞單元集;根據(jù)第二關(guān)鍵詞單元集對新聞標題集進行第二文本匹配,識別得到熱點新聞標題。本發(fā)明的計算復(fù)雜度低且識別精度高,可廣泛應(yīng)用于文字處理技術(shù)領(lǐng)域。 |





