一種分布式爬蟲系統(tǒng)任務抓取系統(tǒng)和方法

基本信息

申請?zhí)?/td> CN201510564985.5 申請日 -
公開(公告)號 CN106503017A 公開(公告)日 2017-03-15
申請公布號 CN106503017A 申請公布日 2017-03-15
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張國強 申請(專利權)人 摩貝(上海)生物科技有限公司
代理機構 上海翰信知識產權代理事務所(普通合伙) 代理人 摩貝(上海)生物科技有限公司;上海摩庫數(shù)據技術有限公司
地址 200131 上海市浦東新區(qū)自由貿易試驗區(qū)富特北路399號1幢樓6層6020室
法律狀態(tài) -

摘要

摘要 本發(fā)明包括爬蟲控制端、爬蟲抓取端、任務監(jiān)控模塊,爬蟲抓取端獲取相應的任務,將任務數(shù)據傳送給爬蟲控制端;爬蟲控制端定義任務編號和任務超時時間,并產生任務分發(fā)事件,存儲任務分發(fā)的時間戳數(shù)據;將任務分發(fā)給任務監(jiān)控模塊和爬蟲抓取端,爬蟲抓取端對抓取任務執(zhí)行相應的抓取邏輯,將任務完成信息傳送給爬蟲控制端,若發(fā)生異常情況,導致抓取任務無法正確的被執(zhí)行時,可以通過任務監(jiān)控模塊重新將任務推送給爬蟲控制端,避免了由于網絡原因、任務無法執(zhí)行的情況。