基于大數(shù)據(jù)的用戶畫像構(gòu)建方法、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110294601.8 申請日 -
公開(公告)號 CN113051324A 公開(公告)日 2021-06-29
申請公布號 CN113051324A 申請公布日 2021-06-29
分類號 G06F16/25;G06F16/28;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫圣力;陳忠毅;李青山;司華友 申請(專利權(quán))人 南京博雅區(qū)塊鏈研究院有限公司
代理機(jī)構(gòu) 無錫永樂唯勤專利代理事務(wù)所(普通合伙) 代理人 孫際德
地址 210000 江蘇省南京市鼓樓區(qū)漢中門大街301號1102-2室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于大數(shù)據(jù)的用戶畫像構(gòu)建方法、裝置及存儲介質(zhì),其中的方法包括:建立用戶畫像標(biāo)簽體系;采集用戶數(shù)據(jù)并存儲至數(shù)據(jù)倉庫內(nèi)預(yù)先構(gòu)建好的實(shí)體表和事實(shí)表內(nèi);將實(shí)體表和事實(shí)表進(jìn)行ID?Mapping關(guān)聯(lián)以實(shí)現(xiàn)對用戶數(shù)據(jù)的聚合;基于用戶畫像標(biāo)簽體系,對于每一個(gè)標(biāo)簽,從數(shù)據(jù)倉庫中獲取與所述標(biāo)簽相關(guān)的用戶數(shù)據(jù)處理后保存至用戶畫像數(shù)據(jù)庫。本發(fā)明采用數(shù)據(jù)倉庫技術(shù)實(shí)現(xiàn)對海量用戶數(shù)據(jù)的存儲及處理,提高了大數(shù)據(jù)時(shí)代對海量數(shù)據(jù)的處理需求。此外,本發(fā)明采用包括機(jī)器學(xué)習(xí)算法在內(nèi)的數(shù)據(jù)挖掘工具實(shí)現(xiàn)對非結(jié)構(gòu)用戶數(shù)據(jù)的處理,從而獲得更加豐富的標(biāo)簽數(shù)據(jù),提升了用戶畫像的標(biāo)簽豐富度。