文本分類方法、裝置、終端設(shè)備和可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202011308990.7 申請(qǐng)日 -
公開(公告)號(hào) CN112417153A 公開(公告)日 2021-02-26
申請(qǐng)公布號(hào) CN112417153A 申請(qǐng)公布日 2021-02-26
分類號(hào) G06F16/35(2019.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王欣芝;廖康寧;楊斌 申請(qǐng)(專利權(quán))人 虎博網(wǎng)絡(luò)技術(shù)(上海)有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 梁韜
地址 200050上海市長(zhǎng)寧區(qū)宣化路3號(hào)二層2561室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開了文本分類方法、裝置、終端設(shè)備和可讀存儲(chǔ)介質(zhì),該方法包括:獲取各個(gè)基礎(chǔ)詞對(duì)應(yīng)的基礎(chǔ)詞向量和各個(gè)主題詞對(duì)應(yīng)的主題詞向量;對(duì)各個(gè)主題詞向量進(jìn)行降維處理,以獲得各個(gè)主題詞向量對(duì)應(yīng)的低維主題詞向量;確定各個(gè)主題詞的類別總數(shù)和同類主題詞的數(shù)目;計(jì)算第i個(gè)類別中的k個(gè)低維主題詞向量的平均主題詞向量,將各個(gè)基礎(chǔ)詞向量分別和平均主題詞向量拼接;將各個(gè)拼接向量依次輸入至預(yù)先訓(xùn)練達(dá)標(biāo)的文本分類模型,以確定文本內(nèi)容對(duì)應(yīng)第i個(gè)類別的概率值。本發(fā)明的技術(shù)方案使得各個(gè)詞向量與類別相關(guān)的特征增強(qiáng),與類別不相關(guān)的特征減弱,使得文本分類模型能更快速、更準(zhǔn)確的確定文本內(nèi)容的對(duì)應(yīng)類別。??