基于知識(shí)圖譜對(duì)大量直播彈幕數(shù)據(jù)意圖標(biāo)注方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202110651380.5 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN113408252A | 公開(kāi)(公告)日 | 2021-09-17 |
| 申請(qǐng)公布號(hào) | CN113408252A | 申請(qǐng)公布日 | 2021-09-17 |
| 分類號(hào) | G06F40/169(2020.01)I;G06F40/186(2020.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/215(2019.01)I;G06F16/74(2019.01)I;G06F16/75(2019.01)I;G06F16/78(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 李抒雁;沙濤 | 申請(qǐng)(專利權(quán))人 | 上海適享文化傳播有限公司 |
| 代理機(jī)構(gòu) | 南京鼎傲知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉藹民 |
| 地址 | 200120上海市浦東新區(qū)成山路800號(hào)A座1106室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開(kāi)了基于知識(shí)圖譜對(duì)大量直播彈幕數(shù)據(jù)意圖標(biāo)注方法,包括如下步驟:S1、根據(jù)彈幕信息提取關(guān)鍵詞并對(duì)關(guān)鍵詞歸納維度;S2、擴(kuò)建關(guān)鍵詞同音同義詞;S3、多個(gè)維度組合作為一個(gè)特定意圖的模板;S4、彈幕數(shù)據(jù)去重,無(wú)效數(shù)據(jù)去除;S5、彈幕數(shù)據(jù)過(guò)模板抽取觀點(diǎn)意圖;S6、人工校排查去除錯(cuò)誤數(shù)據(jù),本發(fā)明結(jié)構(gòu)科學(xué)合理,使用安全方便,本發(fā)明為快速標(biāo)注直播彈幕數(shù)據(jù)意圖,高效率標(biāo)注文本意圖,克服了數(shù)據(jù)量龐大人工效率低,傳統(tǒng)NLP在彈幕分析中效果差等缺點(diǎn),對(duì)于數(shù)據(jù)中的語(yǔ)義進(jìn)行定義,從而便于彈幕數(shù)據(jù)去重,降低了工作量,適合更好的推廣使用。 |





