一種半監(jiān)督的領(lǐng)域詞挖掘與分類(lèi)的方法和設(shè)備
基本信息

| 申請(qǐng)?zhí)?/td> | CN201710748366.0 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN107577739B | 公開(kāi)(公告)日 | 2020-04-10 |
| 申請(qǐng)公布號(hào) | CN107577739B | 申請(qǐng)公布日 | 2020-04-10 |
| 分類(lèi)號(hào) | G06F16/33;G06F16/35;G06K9/62 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 高登科;姚佳 | 申請(qǐng)(專(zhuān)利權(quán))人 | 廣東惠禾科技發(fā)展有限公司 |
| 代理機(jī)構(gòu) | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 深圳市空谷幽蘭人工智能科技有限公司;廣東惠禾科技發(fā)展有限公司 |
| 地址 | 518054 廣東省深圳市南山區(qū)粵海街道學(xué)府路2388號(hào)怡化金融科技大廈14樓01-02單元 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實(shí)例提出了一種半監(jiān)督的領(lǐng)域詞挖掘與分類(lèi)的方法和設(shè)備,其中該方法包括:對(duì)領(lǐng)域相關(guān)語(yǔ)料進(jìn)行預(yù)處理以及構(gòu)建種子詞表和詞語(yǔ)相似度矩陣,挖掘候選領(lǐng)域詞以及確定候選領(lǐng)域詞的相似度分布,對(duì)篩選出的領(lǐng)域詞進(jìn)行類(lèi)別的標(biāo)記;以此通過(guò)半監(jiān)督的方式,無(wú)需大量標(biāo)注數(shù)據(jù),只需要基于一般的領(lǐng)域文本和少量種子詞表即可完成領(lǐng)域詞的挖掘與分類(lèi)。 |





