面向健康輿情的文本分類方法

基本信息

申請?zhí)?/td> CN201810582880.6 申請日 -
公開(公告)號 CN108829810A 公開(公告)日 2018-11-16
申請公布號 CN108829810A 申請公布日 2018-11-16
分類號 G06F17/30;G06F17/27;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 陳雷霆;李巧平;陳秋生;徐安;陳雅琳;劉薇;陳淑珠 申請(專利權(quán))人 廣東迪特賽恩軟件技術(shù)有限公司
代理機構(gòu) 北京匯捷知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 東莞迪賽軟件技術(shù)有限公司;電子科技大學廣東電子信息工程研究院
地址 523000 廣東省東莞市松山湖高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)總部二路17號A411
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種面向健康輿情的文本分類方法,涉及信息技術(shù)領(lǐng)域,該面向健康輿情的文本分類方法結(jié)合深度神經(jīng)網(wǎng)絡(luò)和LightGBM兩者的優(yōu)勢,利用深度神經(jīng)網(wǎng)絡(luò)自動學習特征,將最后一層特征作為LightGBM集成學習方法的輸入,并對多個模型進行模型融合。實現(xiàn)端到端的特征學習,無需人工構(gòu)建特征工程,且能有效提高文本分類的準確率。該面向健康輿情的文本分類方法采用端到端自動進行特征學習,無需人工構(gòu)建特征工程;模型通用,無需使用其他外部信息,且與具體應(yīng)用場景無關(guān);推廣能力強,可直接應(yīng)用于其它文本分類和回歸任務(wù);提高文本分類的準確率。