一種基于語料領(lǐng)域的語料處理系統(tǒng)
基本信息

| 申請?zhí)?/td> | CN201910009322.5 | 申請日 | - |
| 公開(公告)號 | CN109871533B | 公開(公告)日 | 2019-12-10 |
| 申請公布號 | CN109871533B | 申請公布日 | 2019-12-10 |
| 分類號 | G06F17/27(2006.01); G06K9/62(2006.01); G06N3/04(2006.01); G06N3/08(2006.01) | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 孔洋洋; 陳飛宇; 朱勁松 | 申請(專利權(quán))人 | 北京車慧科技有限公司 |
| 代理機構(gòu) | 北京市維詩律師事務(wù)所 | 代理人 | 李翔;楊安進 |
| 地址 | 100044 北京市海淀區(qū)西直門外大街168號騰達大廈21層2101-2103、2105-2111 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請公開了一種基于語料領(lǐng)域的語料處理系統(tǒng)。該系統(tǒng)包括:第一訓(xùn)練模塊,用于根據(jù)開放領(lǐng)域語料訓(xùn)練第一編碼模型,根據(jù)目標領(lǐng)域參考語料訓(xùn)練第二編碼模型;向量模塊,用于將目標領(lǐng)域語料輸入所述第一編碼模型得到第一向量,將目標領(lǐng)域語料輸入所述第二編碼模型得到第二向量,將目標領(lǐng)域語料輸入第三模型得到第三向量;第二訓(xùn)練模塊,用于根據(jù)所述第一向量、所述第二向量以及所述第三向量訓(xùn)練語料處理模型。本申請的提供的技術(shù)方案,由于利用了開放領(lǐng)域的先驗知識,減少了標簽數(shù)據(jù)使用量,使得不僅效果得到顯著提升,而且訓(xùn)練時間也大大縮短。 |





