長文本的輿情分類優(yōu)化方法
基本信息

| 申請?zhí)?/td> | CN202111060615.X | 申請日 | - |
| 公開(公告)號 | CN114153967A | 公開(公告)日 | 2022-03-08 |
| 申請公布號 | CN114153967A | 申請公布日 | 2022-03-08 |
| 分類號 | G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 唐亮;曹特磊;趙偉 | 申請(專利權(quán))人 | 時趣互動(北京)科技有限公司 |
| 代理機構(gòu) | 北京智慧亮點知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 史明罡 |
| 地址 | 100020北京市朝陽區(qū)建國路118號4層401內(nèi)C11 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了長文本的輿情分類優(yōu)化方法,包括以下步驟:a.對輸入的文本先用傳統(tǒng)的bert微調(diào)后的模型進行輿情判斷,對判斷為中性輿情的文本,再判斷該文本的長度,是否超過設(shè)置的長度閾值;b.不超過就維持原始的輿情判斷結(jié)果,超過則進行更細致的輿情分析;c.將當前文本同時分別發(fā)給預(yù)訓(xùn)練和微調(diào)后的bert模型,得到當前文本中的各個字符在微調(diào)前后的語義向量。本申請中,利用bert模型在微調(diào)前后的字符語義的變化,將其應(yīng)用于針對長文本的輿情分類任務(wù)中;通過識別有輿情傾向的文本片段,減少整體被判斷為中性的概率,更好的識別出用戶的細節(jié)輿情傾向。 |





