漢語句子混合模板的挖掘方法及裝置

基本信息

申請?zhí)?/td> CN201810201422.3 申請日 -
公開(公告)號 CN108563617B 公開(公告)日 2021-09-21
申請公布號 CN108563617B 申請公布日 2021-09-21
分類號 G06F40/216;G06F40/211;G06F40/284;G06F40/295;G06F40/186 分類 計算;推算;計數;
發(fā)明人 任禾 申請(專利權)人 云知聲智能科技股份有限公司
代理機構 - 代理人 -
地址 100096 北京市海淀區(qū)西三旗建材城內1幢一層101號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種漢語句子混合模板的挖掘方法及裝置,其中,該方法包括:獲取預設文本,所述預設文本包括正例文本和負例文本;對預設文本中的每個句子分別進行分析處理,確定句子的每個詞語的詞語參數;根據所有詞語的詞語參數生成句子的候選模板;根據所有句子的所有候選模板合并生成不含有重復候選模板的模板列表,并生成正例模板集和負例模板集;從模板列表中選取目標候選模板,根據目標候選模板的正例次數和負例次數確定目標候選模板的模板類型。該方法生成的句子模板是詞、詞性、命名實體和句法依賴關系的混合表達,可以更加充分地刻畫一個句子中存在的語言規(guī)律,模板匹配能力強。