一種基于機(jī)器學(xué)習(xí)的政策文本分類方法
基本信息

| 申請?zhí)?/td> | CN202011585410.9 | 申請日 | - |
| 公開(公告)號 | CN112668329A | 公開(公告)日 | 2021-04-16 |
| 申請公布號 | CN112668329A | 申請公布日 | 2021-04-16 |
| 分類號 | G06F40/289;G06F40/242;G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06Q50/26 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 龔增輝;胡建敏 | 申請(專利權(quán))人 | 廣州博士信息技術(shù)研究院有限公司 |
| 代理機(jī)構(gòu) | 廣州博士科創(chuàng)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 李永鋒 |
| 地址 | 510000 廣東省廣州市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科學(xué)城科珠路203號1201D | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供一種基于機(jī)器學(xué)習(xí)的政策文本分類方法,包括S1)、將數(shù)據(jù)分類標(biāo)注,單文本標(biāo)注;S2)、將各個(gè)類別的數(shù)據(jù)作為訓(xùn)練的數(shù)據(jù)集,S3)、將政策的標(biāo)題合并為文本,并將文本轉(zhuǎn)化為向量;S4)、選擇CNN算法作為基礎(chǔ)算法,將所有卷積核得到的特征拼接起來即為文本的定長向量表示,對于文本分類問題,將其連接至softmax即構(gòu)建出完整的模型;S5)、定義輸出的數(shù)據(jù);S6)、將向量加入到元組;S7)、定義分類器;S8)、定義損失函數(shù)和準(zhǔn)確函數(shù)S9)、定義優(yōu)化方法,S10)、網(wǎng)絡(luò)訓(xùn)練;S11)、模型評估;S12)、模型預(yù)測。本發(fā)明具有高效、準(zhǔn)確的、智能的政策分類的效果,實(shí)現(xiàn)了大規(guī)模處理政策數(shù)據(jù)的分類的難題。 |





