NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法

基本信息

申請(qǐng)?zhí)?/td> CN202210376883.0 申請(qǐng)日 -
公開(公告)號(hào) CN114692621A 公開(公告)日 2022-07-01
申請(qǐng)公布號(hào) CN114692621A 申請(qǐng)公布日 2022-07-01
分類號(hào) G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 秦韻;張帆 申請(qǐng)(專利權(quán))人 南京工業(yè)大學(xué)
代理機(jī)構(gòu) 南京科闊知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 -
地址 211899江蘇省南京市江北新區(qū)浦珠南路30號(hào)
法律狀態(tài) -

摘要

摘要 一種NLP中基于樣本的序列到序列任務(wù)的影響函數(shù)解釋方法,包括步驟:1)選取需要獲取解釋的序列到序列任務(wù),并針對(duì)序列到序列任務(wù)選取待測(cè)的自然語言處理模型和數(shù)據(jù)集;2)將數(shù)據(jù)集內(nèi)的語料進(jìn)行編碼,將編碼后的每條數(shù)據(jù)劃分不同區(qū)間得到的多條數(shù)據(jù)并作為新的樣本;3)將步驟2)得到的新的樣本送入待測(cè)模型進(jìn)行訓(xùn)練,在損失趨于穩(wěn)定時(shí)結(jié)束訓(xùn)練;在待測(cè)模型訓(xùn)練過程輸出的所有檢查點(diǎn)中,選取趨近于待測(cè)模型最終參數(shù)的檢查點(diǎn)用于影響分?jǐn)?shù)的計(jì)算;4)基于步驟3)選取的檢查點(diǎn)中的待測(cè)模型參數(shù),計(jì)算訓(xùn)練樣本與測(cè)試樣本的損失;5)利用步驟4)得到的樣本損失,基于待測(cè)模型參數(shù)計(jì)算梯度向量,按照影響函數(shù)公式計(jì)算得到影響分?jǐn)?shù)。