一種基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理方法

基本信息

申請?zhí)?/td> CN201710044292.2 申請日 -
公開(公告)號 CN106844636A 公開(公告)日 2017-06-13
申請公布號 CN106844636A 申請公布日 2017-06-13
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 沙云飛;李晨放;趙雪晴;王天然;郝聞眾;丁浣;鄭培晨;宋力 申請(專利權(quán))人 常州倍源無限數(shù)據(jù)科技有限公司
代理機構(gòu) - 代理人 -
地址 213000 江蘇省常州市武進區(qū)常武中路18—50號常州科教城創(chuàng)研港5—106
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理方法,屬于大數(shù)據(jù)處理技術(shù)領(lǐng)域,該基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理方法,包括:1)非結(jié)構(gòu)化數(shù)據(jù)的存儲,基于Hadoop的大數(shù)據(jù)框架,解決非結(jié)構(gòu)化數(shù)據(jù)的存儲、管理、訪問;2)非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理,利用大數(shù)據(jù)平臺的ETL能力,完成數(shù)據(jù)預(yù)處理(清洗、轉(zhuǎn)換、挖掘、搜索);3)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化處理,采用時空分割、特征提取、對象識別等處理手段,實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)向信息、情報的轉(zhuǎn)化;4)非結(jié)構(gòu)化數(shù)據(jù)的處理能力提升,利用深度學(xué)習(xí)算法來替代手工獲取特征分析。本發(fā)明可以實現(xiàn)海量非結(jié)構(gòu)化數(shù)據(jù)的存儲,支持非結(jié)構(gòu)化數(shù)據(jù)的批量、實時處理,增強非結(jié)構(gòu)化數(shù)據(jù)處理的效率、準確性和合理性。