一種基于url字符串的數(shù)據(jù)采集方法
基本信息

| 申請?zhí)?/td> | CN201710440457.8 | 申請日 | - |
| 公開(公告)號 | CN107330004A | 公開(公告)日 | 2017-11-07 |
| 申請公布號 | CN107330004A | 申請公布日 | 2017-11-07 |
| 分類號 | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 馬建軍 | 申請(專利權(quán))人 | 上海連源信息科技有限公司 |
| 代理機(jī)構(gòu) | 上海唯源專利代理有限公司 | 代理人 | 上海連源信息科技有限公司 |
| 地址 | 200000 上海市楊浦區(qū)閔楊樹浦路2300號1B層B05-7室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種基于url字符串的數(shù)據(jù)采集方法,通過采集系統(tǒng)在互聯(lián)網(wǎng)上采集符合用戶需求的數(shù)據(jù),包括:a.采集系統(tǒng)基于用戶的輸入生成至少一個(gè)url鏈接及至少一個(gè)url鏈接配置內(nèi)容;b.采集系統(tǒng)基于用戶的輸入生成至少一個(gè)核心字段以及至少一個(gè)核心字段配置內(nèi)容;c.采集系統(tǒng)基于url鏈接、url鏈接配置、核心字段以及核心字段配置內(nèi)容生成采集規(guī)則并基于采集規(guī)則采集數(shù)據(jù)。本發(fā)明通過用戶輸入獲取url鏈接、url鏈接配置內(nèi)容、核心字段及核心字段配置內(nèi)容,基于url鏈接、url鏈接配置、核心字段以及核心字段配置內(nèi)容生成采集規(guī)則并基于采集規(guī)則采集數(shù)據(jù)到指定系統(tǒng),本發(fā)明操作簡單、通過靈活多變的采集規(guī)則、完善的篩選功能,實(shí)現(xiàn)了多元化的數(shù)據(jù)采集,具有極高的商業(yè)價(jià)值。 |





