一種基于albert預訓練模型和kmean算法的評論標簽提取的方法
基本信息

| 申請?zhí)?/td> | CN202011243154.5 | 申請日 | - |
| 公開(公告)號 | CN112215003A | 公開(公告)日 | 2021-01-12 |
| 申請公布號 | CN112215003A | 申請公布日 | 2021-01-12 |
| 分類號 | G06F40/289(2020.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 廖杰;鄧方華;張衍彬 | 申請(專利權(quán))人 | 深圳市洪堡智慧餐飲科技有限公司 |
| 代理機構(gòu) | 深圳市深聯(lián)知識產(chǎn)權(quán)代理事務所(普通合伙) | 代理人 | 張琪 |
| 地址 | 518000廣東省深圳市福田區(qū)梅林街道孖嶺社區(qū)凱豐路10號翠林大廈8層808A | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,具體為一種基于albert預訓練模型和kmean算法的評論標簽提取的方法,該方法的步驟如下:步驟一、爬取門店的評論數(shù)據(jù),數(shù)據(jù)導入到數(shù)據(jù)庫中;步驟二、對數(shù)據(jù)庫的數(shù)據(jù)進行數(shù)據(jù)清洗;步驟三、利用albert預訓練模型獲得詞向量;步驟四、評估模型的平均準確率,本發(fā)明利用albert作為預訓練模型,模型小,訓練速度快,對于大規(guī)模數(shù)據(jù)情況下,效果更好,本發(fā)明利用kmean算法作為無監(jiān)督的聚類算法,通過獲取albert的最后一層詞向量作為輸入,并最終通過kmean聚類算法聚類,達到更為準確的預估準確率。?? |





