一種多標簽復雜文本分類方法

基本信息

申請?zhí)?/td> CN202011328247.8 申請日 -
公開(公告)號 CN113342970A 公開(公告)日 2021-09-03
申請公布號 CN113342970A 申請公布日 2021-09-03
分類號 G06F16/35(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王志鵬;孫力澤;朱西華;鄧強 申請(專利權(quán))人 中電萬維信息技術(shù)有限責任公司
代理機構(gòu) 蘭州嘉諾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 郭海
地址 730000甘肅省蘭州市城關(guān)區(qū)張?zhí)K灘553號(電信第二樞紐B區(qū)4-7層)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及的技術(shù)領(lǐng)域為人工智能領(lǐng)域,具體是一種基于Bert對多標簽復雜文本分類方法。本發(fā)明旨在解決文本在數(shù)量多的情況下且類別復雜的文本分類問題。方法步驟包括:a)利用Bert提取文本信息;b)將Bert提取出來信息分別放入Attention和Cnn兩個層中繼續(xù)做特征提取;c)根據(jù)結(jié)果進行迭代學習。在海量的信息中挑出有效的信息,利用模型提取出其中信息并進行準確分類。