一種半監(jiān)督的領(lǐng)域詞挖掘與分類(lèi)的方法和設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201710748366.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107577739B 公開(kāi)(公告)日 2020-04-10
申請(qǐng)公布號(hào) CN107577739B 申請(qǐng)公布日 2020-04-10
分類(lèi)號(hào) G06F16/33;G06F16/35;G06K9/62 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 高登科;姚佳 申請(qǐng)(專(zhuān)利權(quán))人 廣東惠禾科技發(fā)展有限公司
代理機(jī)構(gòu) 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市空谷幽蘭人工智能科技有限公司;廣東惠禾科技發(fā)展有限公司
地址 518054 廣東省深圳市南山區(qū)粵海街道學(xué)府路2388號(hào)怡化金融科技大廈14樓01-02單元
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)例提出了一種半監(jiān)督的領(lǐng)域詞挖掘與分類(lèi)的方法和設(shè)備,其中該方法包括:對(duì)領(lǐng)域相關(guān)語(yǔ)料進(jìn)行預(yù)處理以及構(gòu)建種子詞表和詞語(yǔ)相似度矩陣,挖掘候選領(lǐng)域詞以及確定候選領(lǐng)域詞的相似度分布,對(duì)篩選出的領(lǐng)域詞進(jìn)行類(lèi)別的標(biāo)記;以此通過(guò)半監(jiān)督的方式,無(wú)需大量標(biāo)注數(shù)據(jù),只需要基于一般的領(lǐng)域文本和少量種子詞表即可完成領(lǐng)域詞的挖掘與分類(lèi)。