一種組合新聞分析基于多篇資訊的內容檢索方法

基本信息

申請?zhí)?/td> CN201610920381.4 申請日 -
公開(公告)號 CN107066461A 公開(公告)日 2017-08-18
申請公布號 CN107066461A 申請公布日 2017-08-18
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數;
發(fā)明人 李學良 申請(專利權)人 天津海量信息技術股份有限公司
代理機構 - 代理人 -
地址 300000 天津市濱海新區(qū)華苑產業(yè)區(qū)榕苑路1號B北322-323室
法律狀態(tài) -

摘要

摘要 一種組合新聞分析基于多篇資訊的內容檢索方法,其特征在于:包括步驟一,將多篇資訊url組合到一起;作為要評估的輸入項;步驟二,根據這些url對數據進行召回;首先獲取url對應資訊的md5;根據獲取到的這一批md5進行數據召回;每條url對應資訊最多有十條md5,如果對五個url進行組合評估,就將這五條url的md5都獲取過來,進行召回數據;步驟三,對召回的數據通過歸堆算法進行歸堆;步驟四,將歸堆后新聞進行評估分析,響應給用戶。