文本主題的分類方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201510341937.X 申請日 -
公開(公告)號 CN105045812B 公開(公告)日 2019-01-29
申請公布號 CN105045812B 申請公布日 2019-01-29
分類號 G06F16/35 分類 計算;推算;計數(shù);
發(fā)明人 周誠;趙世亭;趙營營 申請(專利權(quán))人 上海高欣計算機系統(tǒng)有限公司
代理機構(gòu) 上海晨皓知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 上海高欣計算機系統(tǒng)有限公司
地址 201203 上海市浦東新區(qū)自由貿(mào)易試驗區(qū)芳春路400號1幢301-103室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及文本主題分類技術(shù)領(lǐng)域,公開了一種文本主題的分類方法及系統(tǒng)。本發(fā)明中,文本主題的分類方法,包含以下步驟:采集語料;其中,語料包含各個主題類型的文本;對語料進行分詞,并對分詞后的語料進行文本特征提取,得到各主題類型文本的特征向量;根據(jù)動態(tài)對數(shù)激勵函數(shù)調(diào)整各主題類型文本的特征向量中的特征值,得到新的各主題類型文本的特征向量;根據(jù)待分類文本與新的各主題類型文本的特征向量的相似度,對待分類文本進行分類,確定待分類文本的主題類型。這樣,使得對文本分類更準確。