基于句法分析和聚類的三元組生成方法、裝置及用戶終端
基本信息

| 申請?zhí)?/td> | CN201711408501.3 | 申請日 | - |
| 公開(公告)號 | CN108133014B | 公開(公告)日 | 2022-03-22 |
| 申請公布號 | CN108133014B | 申請公布日 | 2022-03-22 |
| 分類號 | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06Q30/02(2012.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 牟昊;楊飛 | 申請(專利權)人 | 廣州數(shù)說故事信息科技有限公司 |
| 代理機構 | 廣州科捷知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 楊晶晶 |
| 地址 | 510623廣東省廣州市天河區(qū)黃埔大道西100號之一702房之五 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了基于句法分析和聚類的三元組生成方法、裝置及用戶終端,方法包括:獲取文本信息,清洗噪音并劃分為句子;將句子劃分為至少一個詞語;按句子順序?qū)⒃~語以及其對應的詞性作為輸入,構建句法依賴樹;將句法依賴樹轉(zhuǎn)換為無向圖,利用寬度搜索技術生成二元組,二元組表達為(特征詞,情感詞);獲取二元組中的特征詞,將特征詞轉(zhuǎn)換為特征向量;將特征向量作為輸入,通過K?Means算法進行聚類,使特征詞聚類為對應的類別;獲取對應的類別的ID,記為類別ID,輸出三元組,三元組表達為(類別ID,特征詞,情感詞)。本發(fā)明的優(yōu)點在于通過句法分析發(fā)現(xiàn)二元組,通過特征詞聚類,將類似的特征詞聚在一起,同時降低了人工成本。 |





