短語挖掘方法及裝置
基本信息

| 申請?zhí)?/td> | CN201610388226.2 | 申請日 | - |
| 公開(公告)號 | CN107463548B | 公開(公告)日 | 2021-04-27 |
| 申請公布號 | CN107463548B | 申請公布日 | 2021-04-27 |
| 分類號 | G06F40/289;G06F40/47 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 史黎鑫;張海波;趙宇;駱衛(wèi)華;林鋒;卞華明;管陶然;劉禹 | 申請(專利權)人 | 阿里巴巴(中國)網(wǎng)絡技術有限公司 |
| 代理機構 | 北京博思佳知識產權代理有限公司 | 代理人 | 李威;林祥 |
| 地址 | 浙江省杭州市濱江區(qū)網(wǎng)商路699號 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請?zhí)峁┮环N短語挖掘方法及裝置,該方法可以包括:通過預配置的組合策略從原始語料中抽取候選短語集合,所述候選短語集合中包含若干候選短語,且所述候選短語對應于所述組合策略中的至少一個子策略;從所述候選短語集合中,篩選出滿足預設質量條件的短語。通過本申請的技術方案,可以擴展候選短語集合的覆蓋度,避免漏失潛在的高質量短語,以實現(xiàn)對高質量短語的準確挖掘。 |





