一種文本分類方法及裝置

基本信息

申請?zhí)?/td> CN202111386639.4 申請日 -
公開(公告)號 CN114048290A 公開(公告)日 2022-02-15
申請公布號 CN114048290A 申請公布日 2022-02-15
分類號 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/194(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 胡加明;李健銓;劉小康 申請(專利權(quán))人 鼎富智能科技有限公司
代理機構(gòu) 北京弘權(quán)知識產(chǎn)權(quán)代理有限公司 代理人 郭放;許偉群
地址 230000安徽省合肥市高新區(qū)習(xí)友路3333號A1樓19層-B區(qū)
法律狀態(tài) -

摘要

摘要 本申請實施例提供了一種文本分類方法及裝置。其中,該方法包括:獲取文本的文本表示向量與標簽矩陣之間的相似度向量;獲取從相似度向量到文本對應(yīng)的標簽之間的第一損失函數(shù);對文本表示向量進行線性映射,得到文本的對抗向量;獲取從對抗向量到文本對應(yīng)的標簽之間的第二損失函數(shù);將第一損失函數(shù)和第二損失函數(shù)的結(jié)合作為文本分類模型的總損失函數(shù),以訓(xùn)練文本分類模型;根據(jù)訓(xùn)練后的文本分類模型對未知文本進行分類。本申請實施例的技術(shù)方案,通過引入對抗訓(xùn)練使文本分類模型不再專注于學(xué)習(xí)某個類別的簡單特征,而是學(xué)習(xí)到各個類別的共性特征,使文本分類模型學(xué)習(xí)到類別更深層次的表示,提高了文本分類模型的泛化性和魯棒性。