一種領(lǐng)域特征詞的提取方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201310211467.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN103258053B 公開(kāi)(公告)日 2018-01-26
申請(qǐng)公布號(hào) CN103258053B 申請(qǐng)公布日 2018-01-26
分類(lèi)號(hào) G06F17/30 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 車(chē)天文;雷大偉;石志偉;周步戀;楊振東;王喜民 申請(qǐng)(專(zhuān)利權(quán))人 深圳宜搜天下科技股份有限公司
代理機(jī)構(gòu) 深圳市凱達(dá)知識(shí)產(chǎn)權(quán)事務(wù)所 代理人 深圳市宜搜科技發(fā)展有限公司;深圳宜搜天下科技股份有限公司
地址 518026 廣東省深圳市福田區(qū)濱河路與彩田路交匯處聯(lián)合廣場(chǎng)A棟塔樓A5501-A
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信息檢索領(lǐng)域,提供了一種領(lǐng)域特征詞的提取方法,包括,獲取領(lǐng)域?qū)嶓w資源;獲取領(lǐng)域?qū)嶓w的搜索結(jié)果;利用所述搜索結(jié)果提取候選領(lǐng)域特征詞;根據(jù)所述候選領(lǐng)域特征詞,篩選出領(lǐng)域特征詞。本發(fā)明還提供了一種領(lǐng)域特征詞的提取系統(tǒng)。采用本發(fā)明的技術(shù)方案,考慮了領(lǐng)域?qū)嶓w專(zhuān)業(yè)詞與特征詞的關(guān)系,采用通過(guò)領(lǐng)域?qū)I(yè)詞借助搜索引擎來(lái)提取領(lǐng)域特征詞,既不需要在人工規(guī)則上花費(fèi)很大精力投入,過(guò)程中只需要一些明顯的規(guī)則、領(lǐng)域特征詞做后續(xù)分析用;又避免了靠統(tǒng)計(jì)而沒(méi)有大量?jī)?yōu)質(zhì)的統(tǒng)計(jì)語(yǔ)料問(wèn)題。該方案從實(shí)際出發(fā),簡(jiǎn)單易行,效率高,可快速周期性更新,來(lái)提取應(yīng)用于實(shí)際。