一種應用于文本數(shù)據(jù)的情感分析方法

基本信息

申請?zhí)?/td> CN201811400464.6 申請日 -
公開(公告)號 CN109543038A 公開(公告)日 2019-03-29
申請公布號 CN109543038A 申請公布日 2019-03-29
分類號 G06F16/35(2019.01)I; G06K9/62(2006.01)I; G06N3/04(2006.01)I; G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 朱仲書 申請(專利權)人 華西證券股份有限公司
代理機構 成都行之專利代理事務所(普通合伙) 代理人 戴勇靈
地址 610000 四川省成都市天府二街198號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種應用于文本數(shù)據(jù)的情感分析方法,其特征在于,所述方法包括如下步驟:S1:構造若干標記函數(shù),對每條輸入文本數(shù)據(jù)進行情感類別的標注,情感類別分為被劃分為三類即負面情感數(shù)據(jù)類、中性情感數(shù)據(jù)類、正面情感數(shù)據(jù)類;S2:定義標記函數(shù)的先驗概率以及相互關系,標記函數(shù)的先驗概率用于表示該標記函數(shù)輸出的情感類別標注的置信度;S3:令待標記的文本數(shù)據(jù)條數(shù)為D,步驟S1中的標記函數(shù)綜述為N,對每一條文本數(shù)據(jù)都采用N個標記函數(shù)進行標記,得到D*N的標記矩陣Λ;S4:將步驟S2中定義的標記函數(shù)先驗概率與相互關系,以及步驟S3中得到的標記矩陣Λ作為輸入導入到Data Programing算法框架中進行學習,得到輸出為文本數(shù)據(jù)的分類概率。