一種基于語料領(lǐng)域的語料處理系統(tǒng)

基本信息

申請?zhí)?/td> CN201910009322.5 申請日 -
公開(公告)號 CN109871533B 公開(公告)日 2019-12-10
申請公布號 CN109871533B 申請公布日 2019-12-10
分類號 G06F17/27(2006.01); G06K9/62(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 孔洋洋; 陳飛宇; 朱勁松 申請(專利權(quán))人 北京車慧科技有限公司
代理機構(gòu) 北京市維詩律師事務(wù)所 代理人 李翔;楊安進
地址 100044 北京市海淀區(qū)西直門外大街168號騰達大廈21層2101-2103、2105-2111
法律狀態(tài) -

摘要

摘要 本申請公開了一種基于語料領(lǐng)域的語料處理系統(tǒng)。該系統(tǒng)包括:第一訓(xùn)練模塊,用于根據(jù)開放領(lǐng)域語料訓(xùn)練第一編碼模型,根據(jù)目標領(lǐng)域參考語料訓(xùn)練第二編碼模型;向量模塊,用于將目標領(lǐng)域語料輸入所述第一編碼模型得到第一向量,將目標領(lǐng)域語料輸入所述第二編碼模型得到第二向量,將目標領(lǐng)域語料輸入第三模型得到第三向量;第二訓(xùn)練模塊,用于根據(jù)所述第一向量、所述第二向量以及所述第三向量訓(xùn)練語料處理模型。本申請的提供的技術(shù)方案,由于利用了開放領(lǐng)域的先驗知識,減少了標簽數(shù)據(jù)使用量,使得不僅效果得到顯著提升,而且訓(xùn)練時間也大大縮短。