一種信息挖掘方法及系統(tǒng)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110083527.5 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN112800109A | 公開(kāi)(公告)日 | 2021-05-14 |
| 申請(qǐng)公布號(hào) | CN112800109A | 申請(qǐng)公布日 | 2021-05-14 |
| 分類號(hào) | G06F16/2458;G06F16/28;G06F16/27;G06F16/9535;G06K9/62 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 侯佳;彭浩 | 申請(qǐng)(專利權(quán))人 | 杭州蜜兔網(wǎng)絡(luò)科技(集團(tuán))有限公司 |
| 代理機(jī)構(gòu) | 北京漢本專利代理事務(wù)所(普通合伙) | 代理人 | 張?jiān)伱?李婷 |
| 地址 | 311100 浙江省杭州市余杭區(qū)五常街道西溪八方城8幢809、810室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種信息挖掘方法及系統(tǒng),涉及計(jì)算機(jī)技術(shù)領(lǐng)域,包括:獲取用戶數(shù)據(jù),抽取主題信息;根據(jù)主題信息抽取商品,構(gòu)建商品特征庫(kù);抽取人群,標(biāo)注已知用戶人群和未知用戶人群,分別構(gòu)建人群特征庫(kù);將已知人群特征庫(kù)、未知人群特征庫(kù)分別和商品特征庫(kù)關(guān)聯(lián),得到訓(xùn)練樣本數(shù)據(jù)和待預(yù)測(cè)數(shù)據(jù);使用訓(xùn)練樣本數(shù)據(jù)訓(xùn)練分類器;將待預(yù)測(cè)數(shù)據(jù)輸入到訓(xùn)練好的分類器中,標(biāo)注未知用戶人群對(duì)主題信息。本發(fā)明通過(guò)解析用戶數(shù)據(jù),可以根據(jù)主題信息自主理解用戶對(duì)產(chǎn)品的需求,從海量商品中挑選適宜用戶且質(zhì)量高的商品,提高用戶使用體驗(yàn)。特別是對(duì)于母嬰電商領(lǐng)域,可以通過(guò)解析用戶的一些行為,提取對(duì)應(yīng)的用戶孩子信息,大大提高了用戶使用體驗(yàn)。 |





