文本主題的分類方法及系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN201510341937.X | 申請日 | - |
| 公開(公告)號 | CN105045812A | 公開(公告)日 | 2015-11-11 |
| 申請公布號 | CN105045812A | 申請公布日 | 2015-11-11 |
| 分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 周誠;趙世亭;趙營營 | 申請(專利權(quán))人 | 上海高欣計算機(jī)系統(tǒng)有限公司 |
| 代理機(jī)構(gòu) | 上海晨皓知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 上海高欣計算機(jī)系統(tǒng)有限公司 |
| 地址 | 201203 上海市浦東新區(qū)自由貿(mào)易試驗區(qū)芳春路400號1幢301-103室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及文本主題分類技術(shù)領(lǐng)域,公開了一種文本主題的分類方法及系統(tǒng)。本發(fā)明中,文本主題的分類方法,包含以下步驟:采集語料;其中,語料包含各個主題類型的文本;對語料進(jìn)行分詞,并對分詞后的語料進(jìn)行文本特征提取,得到各主題類型文本的特征向量;根據(jù)動態(tài)對數(shù)激勵函數(shù)調(diào)整各主題類型文本的特征向量中的特征值,得到新的各主題類型文本的特征向量;根據(jù)待分類文本與新的各主題類型文本的特征向量的相似度,對待分類文本進(jìn)行分類,確定待分類文本的主題類型。這樣,使得對文本分類更準(zhǔn)確。 |





