基于社交媒體圖表示模型的社會風險事件抽取方法

基本信息

申請?zhí)?/td> CN201610438133.6 申請日 -
公開(公告)號 CN105956197A 公開(公告)日 2016-09-21
申請公布號 CN105956197A 申請公布日 2016-09-21
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 凌立剛;朱海鵬 申請(專利權(quán))人 杭州量知數(shù)據(jù)科技有限公司
代理機構(gòu) 杭州求是專利事務所有限公司 代理人 杭州量知數(shù)據(jù)科技有限公司
地址 310000 浙江省杭州市西湖區(qū)西溪路525號C樓492室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于社交媒體圖表示模型的社會風險事件抽取的方法。包括如下步驟:1)采用HCCG模型對事件建模,定義實體關(guān)系生成規(guī)則,刻畫事件屬性,利用詞級別與流級別的上下文對事件進行多粒度抽取;2)根據(jù)被抽取事件的HCCG圖,利用最大公共子圖和最小公共超圖的信息量之比進行相似度計算;3)通過社交媒體的上下文信息對HCCG進行增量式聚類,在聚類過程中逐漸突出新聞的事件要素;4)通過基于HCCG模型的聚類結(jié)果進行事件判別,判斷聚類結(jié)果是否為真正的事件。本發(fā)明能有效地匯聚分散的社交媒體信息,直觀地用實體關(guān)系模型多粒度地表達中間和最終的事件探測結(jié)果,相比傳統(tǒng)的社交媒體事件抽取方法有更強的泛化應用能力以及更高的精確性。