一種文本分類方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110046183.0 申請(qǐng)日 -
公開(公告)號(hào) CN112380350A 公開(公告)日 2021-02-19
申請(qǐng)公布號(hào) CN112380350A 申請(qǐng)公布日 2021-02-19
分類號(hào) G06F16/35(2019.01)I;G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 于游;姜巍;張珊珊;趙永強(qiáng) 申請(qǐng)(專利權(quán))人 北京育學(xué)園健康管理中心有限公司
代理機(jī)構(gòu) 北京繪聚高科知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 羅碩
地址 100000北京市朝陽區(qū)太陽宮中路16號(hào)院1號(hào)樓4層408
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種文本分類方法和裝置,本發(fā)明通過確定待分類的文本中的多個(gè)基本關(guān)鍵詞,并確定用于表示基本關(guān)鍵詞的在所述文本中的重要程度;當(dāng)在所述多個(gè)基本關(guān)鍵詞中確定位于預(yù)設(shè)的標(biāo)簽分類關(guān)鍵詞表中的標(biāo)簽關(guān)鍵詞,對(duì)所述標(biāo)簽關(guān)鍵詞的基本權(quán)重加權(quán),以增加該標(biāo)簽關(guān)鍵詞的權(quán)重,與此同時(shí),還基于預(yù)設(shè)的詞向量模型確定與所述標(biāo)簽關(guān)鍵詞關(guān)聯(lián)的相關(guān)關(guān)鍵詞,防止遺漏低頻關(guān)鍵詞;最終根據(jù)所述標(biāo)簽分類關(guān)鍵詞表中關(guān)鍵詞與分類結(jié)果的對(duì)應(yīng)關(guān)系,所述基本關(guān)鍵詞、標(biāo)簽關(guān)鍵詞、相關(guān)關(guān)鍵詞以及各自對(duì)應(yīng)的權(quán)重值,綜合確定出文本的分類結(jié)果,以提高分類結(jié)果的準(zhǔn)確度。??