一種信息爬取方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201811564176.4 申請(qǐng)日 -
公開(公告)號(hào) CN109815380A 公開(公告)日 2019-05-28
申請(qǐng)公布號(hào) CN109815380A 申請(qǐng)公布日 2019-05-28
分類號(hào) G06F16/951(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 盧祎明; 溫尚卓; 姜卓; 張青; 劉占魁; 田冬 申請(qǐng)(專利權(quán))人 昆山中創(chuàng)軟件工程有限責(zé)任公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 山東中創(chuàng)軟件工程股份有限公司; 昆山中創(chuàng)軟件工程有限責(zé)任公司
地址 250013 山東省濟(jì)南市歷下區(qū)千佛山東路41-1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種信息爬取方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該方法包括:從服務(wù)器后臺(tái)獲取需要查詢的信息對(duì)應(yīng)的信息要素;將所述信息要素填充到目標(biāo)網(wǎng)頁(yè)的搜索框內(nèi),并觸發(fā)所述目標(biāo)網(wǎng)頁(yè)彈出驗(yàn)證碼;從所述目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)瀏覽器獲取外界人員進(jìn)行驗(yàn)證碼對(duì)應(yīng)驗(yàn)證得到的驗(yàn)證信息,如果所述驗(yàn)證信息表示驗(yàn)證通過(guò),則將所述驗(yàn)證信息返回給所述服務(wù)器后臺(tái),以指示所述服務(wù)器后臺(tái)運(yùn)行的爬蟲程序進(jìn)行需查詢的信息的爬取??梢?jiàn),對(duì)于具有驗(yàn)證碼的網(wǎng)站,本申請(qǐng)自動(dòng)實(shí)現(xiàn)信息搜索及信息爬取等步驟,僅僅需要人工參與驗(yàn)證碼對(duì)應(yīng)驗(yàn)證,從而實(shí)現(xiàn)人工最小化干預(yù),實(shí)現(xiàn)了半自動(dòng)化的信息爬取方式,從而大大提高了信息獲取速度。