一種媒體行業(yè)知識圖譜的構建方法

基本信息

申請?zhí)?/td> CN202110429931.3 申請日 -
公開(公告)號 CN112948510A 公開(公告)日 2021-06-11
申請公布號 CN112948510A 申請公布日 2021-06-11
分類號 G06F16/28;G06F40/295 分類 計算;推算;計數;
發(fā)明人 孫偉芳;朱立松;黃建杰;張勇 申請(專利權)人 央視國際網絡無錫有限公司
代理機構 - 代理人 -
地址 214000 江蘇省無錫市新區(qū)震澤路18號無錫(國家)軟件園金牛座D棟3、5、6樓
法律狀態(tài) -

摘要

摘要 本發(fā)明是媒體行業(yè)知識圖譜的構建方法,包括:1)對媒體數據進行預處理,包括中文單句拆分和組合;2)采用自然語言處理方法,挖掘出有效實體和關系,按照SPO三元組的模式進行三元組建模;3)將建模的三元組存入媒體知識圖譜中;4)基于挖掘出來的實體,從現有通用知識圖譜中匹配抓取新聞娛樂領域數據,填補到媒體知識圖譜中。本發(fā)明的優(yōu)點:(1)本發(fā)明構建的媒體知識圖譜的數據更豐富且更符合媒體行業(yè)的業(yè)務需求;(2)將NLP聯(lián)合提取關系的模型引入到本發(fā)明媒體知識圖譜的構件中,大大簡化了工作的雜度,模型性能優(yōu);(3)構建的媒體知識圖譜作為基礎數據,可為媒體行業(yè)及企業(yè)發(fā)展提供一個大數據分析平臺,數據更全面,關系更清晰。