文本分類方法及終端設(shè)備

基本信息

申請?zhí)?/td> CN201610639588.4 申請日 -
公開(公告)號(hào) CN106326346A 公開(公告)日 2017-01-11
申請公布號(hào) CN106326346A 申請公布日 2017-01-11
分類號(hào) G06F17/30(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周誠;趙世亭 申請(專利權(quán))人 上海高欣計(jì)算機(jī)系統(tǒng)有限公司
代理機(jī)構(gòu) 上海晨皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 成麗杰
地址 201203 上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)芳春路400號(hào)1幢301-103室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信息處理領(lǐng)域,公開了一種文本分類方法及終端設(shè)備。本發(fā)明實(shí)施方式中,計(jì)算N種文本類型的訓(xùn)練樣本分詞后包含各個(gè)詞向量的詞向量矩陣,再基于該詞向量矩陣計(jì)算出每種文本類型的訓(xùn)練樣本的特征向量,并根據(jù)計(jì)算出的訓(xùn)練樣本的特征向量計(jì)算后向傳播神經(jīng)網(wǎng)絡(luò)的輸入量,再根據(jù)該后向傳播神經(jīng)網(wǎng)絡(luò)確定出文本分類器,最后根據(jù)待測試文本的特征向量和文本分類器,確定待測試文本的類型。CBOW對詞向量化時(shí),會(huì)考慮當(dāng)前詞的前面幾個(gè)詞和后面幾個(gè)詞的聯(lián)系,再結(jié)合經(jīng)典的后向傳播神經(jīng)網(wǎng)絡(luò),可使整個(gè)網(wǎng)絡(luò)訓(xùn)練也具有語義特性,可進(jìn)一步讓整個(gè)網(wǎng)絡(luò)認(rèn)知、理解文本內(nèi)容,具有更好的訓(xùn)練效果。