一種基于機(jī)器學(xué)習(xí)的侵權(quán)網(wǎng)頁(yè)判斷方法

基本信息

申請(qǐng)?zhí)?/td> CN201811223048.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109408947A 公開(kāi)(公告)日 2019-03-01
申請(qǐng)公布號(hào) CN109408947A 申請(qǐng)公布日 2019-03-01
分類號(hào) G06F17/50;G06N99/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 林俊 申請(qǐng)(專利權(quán))人 杭州刀豆網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 杭州華知專利事務(wù)所(普通合伙) 代理人 杭州刀豆網(wǎng)絡(luò)科技有限公司
地址 310000 浙江省杭州市余杭區(qū)倉(cāng)前街道良睦路1288號(hào)6號(hào)樓302-8室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于機(jī)器學(xué)習(xí)的侵權(quán)網(wǎng)頁(yè)判斷方法,包括:網(wǎng)頁(yè)源數(shù)據(jù)預(yù)處理生成訓(xùn)練集和測(cè)試集;使用訓(xùn)練集生成分析模型、測(cè)試集測(cè)試不同閾值下分析模型的性能指標(biāo)及人工選擇最優(yōu)閾值;使用分析模型和最優(yōu)閾值對(duì)網(wǎng)頁(yè)進(jìn)行分析判斷是否為侵權(quán)網(wǎng)頁(yè)。本發(fā)明解決了現(xiàn)有采用人工審核網(wǎng)頁(yè)是否侵權(quán)成本高昂、沒(méi)有統(tǒng)一審核標(biāo)準(zhǔn)導(dǎo)致審核緩慢的技術(shù)問(wèn)題。