一種通用文本挖掘方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201510135053.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106156035B 公開(kāi)(公告)日 2019-10-22
申請(qǐng)公布號(hào) CN106156035B 申請(qǐng)公布日 2019-10-22
分類號(hào) G06F16/26 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孟濤;李佳靜 申請(qǐng)(專利權(quán))人 南京網(wǎng)感至察信息科技有限公司
代理機(jī)構(gòu) 北京博雅睿泉專利代理事務(wù)所(特殊普通合伙) 代理人 南京網(wǎng)感至察信息科技有限公司
地址 210014 江蘇省南京市秦淮區(qū)光華路129-3號(hào)南京白下高新技術(shù)產(chǎn)業(yè)園區(qū)A1區(qū)5層511室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種通用文本挖掘的方法,其中包括:步驟1,運(yùn)行網(wǎng)絡(luò)爬蟲(chóng),加載挖掘范圍內(nèi)的挖掘?qū)ο?,步驟2,對(duì)所述挖掘?qū)ο筮M(jìn)行實(shí)際文本提取,得到實(shí)際文本,步驟3,將所述實(shí)際文本形成概念標(biāo)注圖,步驟4,根據(jù)與挖掘目標(biāo)對(duì)應(yīng)的所述概念和概念之間的關(guān)系,將所述概念和關(guān)系編譯形成字節(jié)碼,進(jìn)而形成指令圖,步驟5,將所述概念標(biāo)注圖和所述指令圖進(jìn)行匹配,將所述概念標(biāo)注圖中符合指令圖的概念和關(guān)系的內(nèi)容形成分析結(jié)果。本發(fā)明的通用文本挖掘方法能夠?qū)ν诰蚰繕?biāo)、挖掘范圍和挖掘方法等進(jìn)行形式化的描述,達(dá)到在不同領(lǐng)域進(jìn)行文本檢索和挖掘的效果。