NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法
基本信息

| 申請(qǐng)?zhí)?/td> | CN202210376883.0 | 申請(qǐng)日 | - |
| 公開(公告)號(hào) | CN114692621A | 公開(公告)日 | 2022-07-01 |
| 申請(qǐng)公布號(hào) | CN114692621A | 申請(qǐng)公布日 | 2022-07-01 |
| 分類號(hào) | G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 秦韻;張帆 | 申請(qǐng)(專利權(quán))人 | 南京工業(yè)大學(xué) |
| 代理機(jī)構(gòu) | 南京科闊知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | - |
| 地址 | 211899江蘇省南京市江北新區(qū)浦珠南路30號(hào) | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 一種NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法,包括步驟:1)選取需要獲取解釋的序列到序列任務(wù),并針對(duì)序列到序列任務(wù)選取待測(cè)的自然語言處理模型和數(shù)據(jù)集;2)將數(shù)據(jù)集內(nèi)的語料進(jìn)行編碼,將編碼后的每條數(shù)據(jù)劃分不同區(qū)間得到的多條數(shù)據(jù)并作為新的樣本;3)將步驟2)得到的新的樣本送入待測(cè)模型進(jìn)行訓(xùn)練,在損失趨于穩(wěn)定時(shí)結(jié)束訓(xùn)練;在待測(cè)模型訓(xùn)練過程輸出的所有檢查點(diǎn)中,選取趨近于待測(cè)模型最終參數(shù)的檢查點(diǎn)用于影響分?jǐn)?shù)的計(jì)算;4)基于步驟3)選取的檢查點(diǎn)中的待測(cè)模型參數(shù),計(jì)算訓(xùn)練樣本與測(cè)試樣本的損失;5)利用步驟4)得到的樣本損失,基于待測(cè)模型參數(shù)計(jì)算梯度向量,按照影響函數(shù)公式計(jì)算得到影響分?jǐn)?shù)。 |





