一種文本分類方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202111396144.X | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN114091451A | 公開(kāi)(公告)日 | 2022-02-25 |
| 申請(qǐng)公布號(hào) | CN114091451A | 申請(qǐng)公布日 | 2022-02-25 |
| 分類號(hào) | G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 王偉;黃勇其;于翠翠;張黔 | 申請(qǐng)(專利權(quán))人 | 華潤(rùn)數(shù)字科技有限公司 |
| 代理機(jī)構(gòu) | 深圳市世聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 楊暉瓊 |
| 地址 | 518000廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號(hào)深圳新一代產(chǎn)業(yè)園2棟801 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實(shí)施例屬于人工智能領(lǐng)域,尤其涉及一種文本分類方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),所述方法包括:獲取待分析文本,對(duì)文本進(jìn)行分詞形成分詞集合,并根據(jù)主題模型獲取文本的主題詞形成主題詞集合;獲取主題詞集合中每個(gè)詞的詞嵌入向量,將詞嵌入向量降維映射到平面上,并根據(jù)平面上的映射點(diǎn)構(gòu)造維諾圖;計(jì)算非主題詞與主題詞之間的語(yǔ)義距離,將非主題詞加入到維諾圖中;識(shí)別維諾圖中每個(gè)詞的詞節(jié)點(diǎn)類型,根據(jù)詞節(jié)點(diǎn)類型通過(guò)對(duì)應(yīng)的算法計(jì)算出詞節(jié)點(diǎn)之間的語(yǔ)義距離;將詞節(jié)點(diǎn)之間的語(yǔ)義距離輸入預(yù)先構(gòu)建的圖卷積神經(jīng)網(wǎng)絡(luò)輸出圖隱含向量,根據(jù)圖隱含向量進(jìn)行文本分類。本發(fā)明提高了文本分類的準(zhǔn)確性。 |





