長文本的輿情分類優(yōu)化方法

基本信息

申請?zhí)?/td> CN202111060615.X 申請日 -
公開(公告)號 CN114153967A 公開(公告)日 2022-03-08
申請公布號 CN114153967A 申請公布日 2022-03-08
分類號 G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 唐亮;曹特磊;趙偉 申請(專利權(quán))人 時趣互動(北京)科技有限公司
代理機構(gòu) 北京智慧亮點知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 史明罡
地址 100020北京市朝陽區(qū)建國路118號4層401內(nèi)C11
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了長文本的輿情分類優(yōu)化方法,包括以下步驟:a.對輸入的文本先用傳統(tǒng)的bert微調(diào)后的模型進行輿情判斷,對判斷為中性輿情的文本,再判斷該文本的長度,是否超過設(shè)置的長度閾值;b.不超過就維持原始的輿情判斷結(jié)果,超過則進行更細致的輿情分析;c.將當前文本同時分別發(fā)給預(yù)訓(xùn)練和微調(diào)后的bert模型,得到當前文本中的各個字符在微調(diào)前后的語義向量。本申請中,利用bert模型在微調(diào)前后的字符語義的變化,將其應(yīng)用于針對長文本的輿情分類任務(wù)中;通過識別有輿情傾向的文本片段,減少整體被判斷為中性的概率,更好的識別出用戶的細節(jié)輿情傾向。