一種通用文本挖掘方法和系統(tǒng)
基本信息

| 申請(qǐng)?zhí)?/td> | CN201510135053.9 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN106156035B | 公開(kāi)(公告)日 | 2019-10-22 |
| 申請(qǐng)公布號(hào) | CN106156035B | 申請(qǐng)公布日 | 2019-10-22 |
| 分類號(hào) | G06F16/26 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 孟濤;李佳靜 | 申請(qǐng)(專利權(quán))人 | 南京網(wǎng)感至察信息科技有限公司 |
| 代理機(jī)構(gòu) | 北京博雅睿泉專利代理事務(wù)所(特殊普通合伙) | 代理人 | 南京網(wǎng)感至察信息科技有限公司 |
| 地址 | 210014 江蘇省南京市秦淮區(qū)光華路129-3號(hào)南京白下高新技術(shù)產(chǎn)業(yè)園區(qū)A1區(qū)5層511室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了一種通用文本挖掘的方法,其中包括:步驟1,運(yùn)行網(wǎng)絡(luò)爬蟲(chóng),加載挖掘范圍內(nèi)的挖掘?qū)ο?,步驟2,對(duì)所述挖掘?qū)ο筮M(jìn)行實(shí)際文本提取,得到實(shí)際文本,步驟3,將所述實(shí)際文本形成概念標(biāo)注圖,步驟4,根據(jù)與挖掘目標(biāo)對(duì)應(yīng)的所述概念和概念之間的關(guān)系,將所述概念和關(guān)系編譯形成字節(jié)碼,進(jìn)而形成指令圖,步驟5,將所述概念標(biāo)注圖和所述指令圖進(jìn)行匹配,將所述概念標(biāo)注圖中符合指令圖的概念和關(guān)系的內(nèi)容形成分析結(jié)果。本發(fā)明的通用文本挖掘方法能夠?qū)ν诰蚰繕?biāo)、挖掘范圍和挖掘方法等進(jìn)行形式化的描述,達(dá)到在不同領(lǐng)域進(jìn)行文本檢索和挖掘的效果。 |





