一種會(huì)話意圖智能識(shí)別模型的構(gòu)建方法、裝置及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010968430.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112131890A 公開(kāi)(公告)日 2020-12-25
申請(qǐng)公布號(hào) CN112131890A 申請(qǐng)公布日 2020-12-25
分類號(hào) G06F40/35(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周鵬飛;馬亮 申請(qǐng)(專利權(quán))人 北京慧辰資道資訊股份有限公司
代理機(jī)構(gòu) 北京壹川鳴知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 林潮
地址 100089北京市海淀區(qū)知春路甲48號(hào)2號(hào)樓20層20B室
法律狀態(tài) -

摘要

摘要 本發(fā)明適用大數(shù)據(jù)人工智能技術(shù)領(lǐng)域,提供會(huì)話意圖智能識(shí)別模型的構(gòu)建方法、裝置及設(shè)備,包括:獲取語(yǔ)料數(shù)據(jù),所述語(yǔ)料數(shù)據(jù)包括已標(biāo)注語(yǔ)料數(shù)據(jù)以及未標(biāo)注語(yǔ)料數(shù)據(jù);根據(jù)已標(biāo)注語(yǔ)料數(shù)據(jù)以及預(yù)設(shè)的語(yǔ)義分析算法,對(duì)未標(biāo)注語(yǔ)料數(shù)據(jù)進(jìn)行處理,生成有標(biāo)簽信息的意圖語(yǔ)料數(shù)據(jù);根據(jù)意圖語(yǔ)料數(shù)據(jù),對(duì)預(yù)設(shè)的初始意圖識(shí)別模型進(jìn)行迭代訓(xùn)練,構(gòu)建目標(biāo)意圖識(shí)別模型。本發(fā)明利用大量無(wú)標(biāo)注語(yǔ)料數(shù)據(jù),基于預(yù)設(shè)的語(yǔ)義分析算法,實(shí)現(xiàn)訓(xùn)練語(yǔ)料半自動(dòng)標(biāo)注,僅需少量糾正即可完成大規(guī)模語(yǔ)料標(biāo)注過(guò)程,降低語(yǔ)料標(biāo)注成本;另外,將語(yǔ)料標(biāo)注、模型優(yōu)化問(wèn)題作為一個(gè)統(tǒng)一任務(wù)進(jìn)行迭代,實(shí)現(xiàn)意圖識(shí)別模型生成過(guò)程中人工干預(yù)最小化、解決數(shù)據(jù)標(biāo)注耗時(shí)、模型訓(xùn)練困難的問(wèn)題。??