一種基于適配器的遷移學習方法、裝置、設備及存儲介質
基本信息

| 申請?zhí)?/td> | CN202111396195.2 | 申請日 | - |
| 公開(公告)號 | CN114091452A | 公開(公告)日 | 2022-02-25 |
| 申請公布號 | CN114091452A | 申請公布日 | 2022-02-25 |
| 分類號 | G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 王偉;黃勇其;于翠翠;張黔 | 申請(專利權)人 | 華潤數(shù)字科技有限公司 |
| 代理機構 | 深圳市世聯(lián)合知識產(chǎn)權代理有限公司 | 代理人 | 劉暢 |
| 地址 | 518000廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號深圳新一代產(chǎn)業(yè)園2棟801 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請公開了一種基于適配器的遷移學習方法、裝置、設備及存儲介質,屬于人工智能技術領域。本申請基于全連接網(wǎng)絡和transformer模型的編碼器構建初始遷移學習模型,其中,初始遷移學習模型包括若干個適配器,然后通過預處理后的訓練樣本對初始遷移學習模型進行預訓練,并基于預訓練結果計算每一個適配器的沙普利值,對每一個適配器的沙普利值進行降序排列,得到適配器貢獻隊列,通過適配器貢獻隊列對初始遷移學習模型進行調(diào)整和迭代,得到自注意力遷移學習模型。本申請采用適配器來進行不同學習任務中的知識遷移,降低了訓練開銷。此外,本申請在訓練過程中根據(jù)每個適配器的沙普利值,對適配器的數(shù)量進行縮減,在遷移學習過程中進一步減少了訓練開銷。 |





