一種媒體行業(yè)知識圖譜的構建方法
基本信息

| 申請?zhí)?/td> | CN202110429931.3 | 申請日 | - |
| 公開(公告)號 | CN112948510A | 公開(公告)日 | 2021-06-11 |
| 申請公布號 | CN112948510A | 申請公布日 | 2021-06-11 |
| 分類號 | G06F16/28;G06F40/295 | 分類 | 計算;推算;計數; |
| 發(fā)明人 | 孫偉芳;朱立松;黃建杰;張勇 | 申請(專利權)人 | 央視國際網絡無錫有限公司 |
| 代理機構 | - | 代理人 | - |
| 地址 | 214000 江蘇省無錫市新區(qū)震澤路18號無錫(國家)軟件園金牛座D棟3、5、6樓 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明是媒體行業(yè)知識圖譜的構建方法,包括:1)對媒體數據進行預處理,包括中文單句拆分和組合;2)采用自然語言處理方法,挖掘出有效實體和關系,按照SPO三元組的模式進行三元組建模;3)將建模的三元組存入媒體知識圖譜中;4)基于挖掘出來的實體,從現有通用知識圖譜中匹配抓取新聞娛樂領域數據,填補到媒體知識圖譜中。本發(fā)明的優(yōu)點:(1)本發(fā)明構建的媒體知識圖譜的數據更豐富且更符合媒體行業(yè)的業(yè)務需求;(2)將NLP聯(lián)合提取關系的模型引入到本發(fā)明媒體知識圖譜的構件中,大大簡化了工作的雜度,模型性能優(yōu);(3)構建的媒體知識圖譜作為基礎數據,可為媒體行業(yè)及企業(yè)發(fā)展提供一個大數據分析平臺,數據更全面,關系更清晰。 |





