一種基于自定義權(quán)重算法的網(wǎng)站分類方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111453324.7 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN114048420A | 公開(公告)日 | 2022-02-15 |
| 申請(qǐng)公布號(hào) | CN114048420A | 申請(qǐng)公布日 | 2022-02-15 |
| 分類號(hào) | G06F16/958(2019.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/237(2020.01)I;G06F40/284(2020.01)I;G06K9/62(2022.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 孫濤;陳濤;吳冠標(biāo);孫中民 | 申請(qǐng)(專利權(quán))人 | 天津市國瑞數(shù)碼安全系統(tǒng)股份有限公司 |
| 代理機(jī)構(gòu) | 天津璽名知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉暢 |
| 地址 | 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)海泰綠色產(chǎn)業(yè)基地K1-1-601室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及一種基于自定義權(quán)重算法的網(wǎng)站分類方法,包括:采集網(wǎng)站文本數(shù)據(jù)進(jìn)行初始處理得到網(wǎng)站文本初始處理數(shù)據(jù);利用所述網(wǎng)站文本初始處理數(shù)據(jù)進(jìn)行文本分類,采用大數(shù)據(jù)技術(shù)獲取用戶提供的網(wǎng)站文本,定期更新特征字典,可以第一時(shí)間發(fā)現(xiàn)新特征、新重點(diǎn),從而提升此方法的感知敏感度,保障分類活躍度,微觀上拋棄傳統(tǒng)大篇幅文本分類機(jī)制,提取主題作為分析內(nèi)容可以壓縮單次處理成本,提高效率;宏觀上采用大數(shù)據(jù)技術(shù)作為計(jì)算方式,可以應(yīng)對(duì)海量文本快速分類的需求,可以快速的進(jìn)行標(biāo)注,從而提升標(biāo)注效率,且提升分類精確度。 |





