文本分類方法及終端設(shè)備
基本信息

| 申請?zhí)?/td> | CN201610639588.4 | 申請日 | - |
| 公開(公告)號(hào) | CN106326346A | 公開(公告)日 | 2017-01-11 |
| 申請公布號(hào) | CN106326346A | 申請公布日 | 2017-01-11 |
| 分類號(hào) | G06F17/30(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 周誠;趙世亭 | 申請(專利權(quán))人 | 上海高欣計(jì)算機(jī)系統(tǒng)有限公司 |
| 代理機(jī)構(gòu) | 上海晨皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 成麗杰 |
| 地址 | 201203 上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)芳春路400號(hào)1幢301-103室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及信息處理領(lǐng)域,公開了一種文本分類方法及終端設(shè)備。本發(fā)明實(shí)施方式中,計(jì)算N種文本類型的訓(xùn)練樣本分詞后包含各個(gè)詞向量的詞向量矩陣,再基于該詞向量矩陣計(jì)算出每種文本類型的訓(xùn)練樣本的特征向量,并根據(jù)計(jì)算出的訓(xùn)練樣本的特征向量計(jì)算后向傳播神經(jīng)網(wǎng)絡(luò)的輸入量,再根據(jù)該后向傳播神經(jīng)網(wǎng)絡(luò)確定出文本分類器,最后根據(jù)待測試文本的特征向量和文本分類器,確定待測試文本的類型。CBOW對詞向量化時(shí),會(huì)考慮當(dāng)前詞的前面幾個(gè)詞和后面幾個(gè)詞的聯(lián)系,再結(jié)合經(jīng)典的后向傳播神經(jīng)網(wǎng)絡(luò),可使整個(gè)網(wǎng)絡(luò)訓(xùn)練也具有語義特性,可進(jìn)一步讓整個(gè)網(wǎng)絡(luò)認(rèn)知、理解文本內(nèi)容,具有更好的訓(xùn)練效果。 |





