一種文本分類方法和裝置

基本信息

申請?zhí)?/td> CN202110046183.0 申請日 -
公開(公告)號 CN112380350B 公開(公告)日 2021-05-07
申請公布號 CN112380350B 申請公布日 2021-05-07
分類號 G06F16/35(2019.01)I;G06F40/284(2020.01)I 分類 -
發(fā)明人 于游;姜巍;張珊珊;趙永強 申請(專利權)人 北京育學園健康管理中心有限公司
代理機構 北京繪聚高科知識產權代理事務所(普通合伙) 代理人 羅碩
地址 100000北京市朝陽區(qū)西大望路1號2號樓2層會所3內202室1單元
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供一種文本分類方法和裝置,本發(fā)明通過確定待分類的文本中的多個基本關鍵詞,并確定用于表示基本關鍵詞的在所述文本中的重要程度;當在所述多個基本關鍵詞中確定位于預設的標簽分類關鍵詞表中的標簽關鍵詞,對所述標簽關鍵詞的基本權重加權,以增加該標簽關鍵詞的權重,與此同時,還基于預設的詞向量模型確定與所述標簽關鍵詞關聯(lián)的相關關鍵詞,防止遺漏低頻關鍵詞;最終根據(jù)所述標簽分類關鍵詞表中關鍵詞與分類結果的對應關系,所述基本關鍵詞、標簽關鍵詞、相關關鍵詞以及各自對應的權重值,綜合確定出文本的分類結果,以提高分類結果的準確度。??