一種基于相似度匹配的文本分類方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN201810704164.0 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN109033212A | 公開(公告)日 | 2018-12-18 |
| 申請(qǐng)公布號(hào) | CN109033212A | 申請(qǐng)公布日 | 2018-12-18 |
| 分類號(hào) | G06F17/30;G06F17/22 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 向湘杰 | 申請(qǐng)(專利權(quán))人 | 上海新諍信知識(shí)產(chǎn)權(quán)服務(wù)股份有限公司 |
| 代理機(jī)構(gòu) | - | 代理人 | - |
| 地址 | 523073 廣東省東莞市南城區(qū)西平下手新村三巷35號(hào)403室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明提供了一種基于相似度匹配的文本分類方法,通過(guò)服務(wù)器接收用戶上傳的待分類的第一文本,對(duì)所述第一文本進(jìn)行詞頻統(tǒng)計(jì),將詞頻統(tǒng)計(jì)結(jié)果輸入分類模型,通過(guò)分類模型識(shí)別出其所屬的第一級(jí)文本類別;根據(jù)所述第一級(jí)文本類別,獲取服務(wù)器中所述第一級(jí)文本類別下所對(duì)應(yīng)的多個(gè)第二文本;服務(wù)器依次計(jì)算第一文本與各個(gè)第二文本之間的相似度;判斷計(jì)算出的相似度最大值是否超出預(yù)設(shè)閾值;若超出,則將第一文本歸類到相似度最大值所對(duì)應(yīng)的第二文本所屬的第二級(jí)文本類別;否則,將第一文本歸類到未識(shí)別文本集中。本發(fā)明公開的文本分類方法,在現(xiàn)有技術(shù)的基礎(chǔ)上,增加了相似文本匹配的步驟,提高了文本分類的效率和準(zhǔn)確性。 |





