短語(yǔ)挖掘方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201610388049.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107463554B 公開(kāi)(公告)日 2021-05-04
申請(qǐng)公布號(hào) CN107463554B 申請(qǐng)公布日 2021-05-04
分類號(hào) G06F40/47;G06F40/58;G06F16/2457 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 卞華明;管陶然;史黎鑫;張海波;劉禹;趙宇;駱衛(wèi)華;林鋒 申請(qǐng)(專利權(quán))人 阿里巴巴(中國(guó))網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李威;林祥
地址 浙江省杭州市濱江區(qū)網(wǎng)商路699號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N短語(yǔ)挖掘方法及裝置,該方法可以包括:從原始語(yǔ)料中抽取候選短語(yǔ)集合,所述候選短語(yǔ)集合中包含若干候選短語(yǔ);將所述候選短語(yǔ)集合分配至若干預(yù)設(shè)處理對(duì)象,以由所述預(yù)設(shè)處理對(duì)象根據(jù)預(yù)定義的篩選條件對(duì)被分配的候選短語(yǔ)進(jìn)行篩選;根據(jù)所述預(yù)設(shè)處理對(duì)象返回的篩選結(jié)果,確定所述候選短語(yǔ)集合中滿足預(yù)設(shè)質(zhì)量條件的短語(yǔ)。通過(guò)本申請(qǐng)的技術(shù)方案,可以實(shí)現(xiàn)對(duì)高質(zhì)量短語(yǔ)的準(zhǔn)確挖掘。