一種點(diǎn)評文本標(biāo)簽的自動提取方案

基本信息

申請?zhí)?/td> CN202110166250.2 申請日 -
公開(公告)號 CN112800180A 公開(公告)日 2021-05-14
申請公布號 CN112800180A 申請公布日 2021-05-14
分類號 G06F16/33;G06F16/35;G06F40/279;G06F40/30;G06N3/04;G06N3/08;G06N7/00 分類 計算;推算;計數(shù);
發(fā)明人 岑袁京 申請(專利權(quán))人 北京易車互聯(lián)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京棘龍知識產(chǎn)權(quán)代理有限公司 代理人 李改平
地址 100089 北京市海淀區(qū)首都體育館南路6號新世紀(jì)飯店3號寫字樓十層D、E、F、G、H、J、單元
法律狀態(tài) -

摘要

摘要 本申請公開了一種點(diǎn)評文本標(biāo)簽的自動提取方案,包括分詞模塊:對點(diǎn)評文本進(jìn)行分詞;詞嵌入模型:根據(jù)海量文本訓(xùn)練處詞語的embedd i ng向量表示;情感極性模型:判斷文本的情感分類,以正向、負(fù)向、中性標(biāo)記;得出點(diǎn)評結(jié)果。本申請的有益效果是:使用了機(jī)器學(xué)習(xí)的方式,自動化提取點(diǎn)評文本的文本標(biāo)簽,在保證正確性的基礎(chǔ)上大大減少了人工標(biāo)注的工作量,同時可挖掘詞語的內(nèi)在語義含義,通過對分散的文本標(biāo)簽進(jìn)行聚類,減少文本標(biāo)簽的類別數(shù),增強(qiáng)數(shù)據(jù)的準(zhǔn)確性,通過文本情感極性模型的引入,可以直觀地對文本進(jìn)行情感分類,并通過點(diǎn)評文本和標(biāo)簽文本的情感極性判斷,完善點(diǎn)評文本和標(biāo)簽文本的匹配效果。