網頁獲取方法和裝置

基本信息

申請?zhí)?/td> CN201310048765.8 申請日 -
公開(公告)號 CN103077254B 公開(公告)日 2017-11-03
申請公布號 CN103077254B 申請公布日 2017-11-03
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 于維緯;劉卓 申請(專利權)人 人民日報媒體技術股份有限公司
代理機構 北京匯智英財專利代理事務所(普通合伙) 代理人 鄭玉潔
地址 100026 北京市朝陽區(qū)金臺西路2號【4-2】9號樓321室
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝艘环N網頁獲取方法和裝置,所述方法包括:確定抓取的網頁中的第一中心hub網頁;解析出所述第一hub網頁中包含的翻頁信息,所述翻頁信息包括翻頁鏈接地址;根據(jù)所述翻頁信息,生成與所述第一hub網頁相關的第二hub網頁地址;根據(jù)所述第二hub網頁地址,獲取內容網頁。通過本申請實施例提高了網頁獲取時的網頁覆蓋率,使得能夠獲取更全面的網絡信息。