一種基于大型通用預(yù)訓(xùn)練模型控制對話生成的方法

基本信息

申請?zhí)?/td> CN202110501116.3 申請日 -
公開(公告)號 CN113420129A 公開(公告)日 2021-09-21
申請公布號 CN113420129A 申請公布日 2021-09-21
分類號 G06F16/332(2019.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 黃洪;王贊;賈勇哲;馬國寧 申請(專利權(quán))人 天津泰凡科技有限公司
代理機(jī)構(gòu) 天津市北洋有限責(zé)任專利代理事務(wù)所 代理人 李素蘭
地址 300072天津市南開區(qū)衛(wèi)津路92號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于大型通用預(yù)訓(xùn)練模型控制評論生成的方法,第一步、通過一個前向過程獲取性模型p(a|x)、p(x);第二步、通過反向傳播獲取相對于H的梯度并更新H;第三步、利用更新之后的H來預(yù)測此時刻的詞典分布;計算Ht的更新值通過若干次重復(fù)計算梯度并衰減求和得到。本發(fā)明基于預(yù)訓(xùn)練的大型通用模型和利用有監(jiān)督的鑒別器,實現(xiàn)可控主題和情感極性的文本評論生成;相對于傳統(tǒng)的beam search解碼評論文本生成,本發(fā)明使用的基于大型預(yù)訓(xùn)練語言模型的生成句子相對更“人性化”。