一種文本分類方法和裝置
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110046183.0 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN112380350A | 公開(公告)日 | 2021-02-19 |
| 申請(qǐng)公布號(hào) | CN112380350A | 申請(qǐng)公布日 | 2021-02-19 |
| 分類號(hào) | G06F16/35(2019.01)I;G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 于游;姜巍;張珊珊;趙永強(qiáng) | 申請(qǐng)(專利權(quán))人 | 北京育學(xué)園健康管理中心有限公司 |
| 代理機(jī)構(gòu) | 北京繪聚高科知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 羅碩 |
| 地址 | 100000北京市朝陽區(qū)太陽宮中路16號(hào)院1號(hào)樓4層408 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實(shí)施例提供一種文本分類方法和裝置,本發(fā)明通過確定待分類的文本中的多個(gè)基本關(guān)鍵詞,并確定用于表示基本關(guān)鍵詞的在所述文本中的重要程度;當(dāng)在所述多個(gè)基本關(guān)鍵詞中確定位于預(yù)設(shè)的標(biāo)簽分類關(guān)鍵詞表中的標(biāo)簽關(guān)鍵詞,對(duì)所述標(biāo)簽關(guān)鍵詞的基本權(quán)重加權(quán),以增加該標(biāo)簽關(guān)鍵詞的權(quán)重,與此同時(shí),還基于預(yù)設(shè)的詞向量模型確定與所述標(biāo)簽關(guān)鍵詞關(guān)聯(lián)的相關(guān)關(guān)鍵詞,防止遺漏低頻關(guān)鍵詞;最終根據(jù)所述標(biāo)簽分類關(guān)鍵詞表中關(guān)鍵詞與分類結(jié)果的對(duì)應(yīng)關(guān)系,所述基本關(guān)鍵詞、標(biāo)簽關(guān)鍵詞、相關(guān)關(guān)鍵詞以及各自對(duì)應(yīng)的權(quán)重值,綜合確定出文本的分類結(jié)果,以提高分類結(jié)果的準(zhǔn)確度。?? |





