語言模型預(yù)訓(xùn)練方法

基本信息

申請?zhí)?/td> CN201910268322.7 申請日 -
公開(公告)號 CN110032644A 公開(公告)日 2019-07-19
申請公布號 CN110032644A 申請公布日 2019-07-19
分類號 G06F16/35;G06F17/27 分類 計算;推算;計數(shù);
發(fā)明人 陳瑤文 申請(專利權(quán))人 人立方智能科技有限公司
代理機(jī)構(gòu) 北京挺立專利事務(wù)所(普通合伙) 代理人 人立方智能科技有限公司
地址 200000 上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗區(qū)金湘路225弄11號1635室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語言模型預(yù)訓(xùn)練方法,其包括如下步驟:對模型中的語料按字、子詞進(jìn)行分詞;對生成的各分詞隨即抽取15%進(jìn)行位置掩蓋、并計算掩蓋后的語義分布;以獨(dú)立的門控制單元對模型中的子詞混合進(jìn)行控制;對語義分布和掩蓋詞的預(yù)測進(jìn)行同步訓(xùn)練。本發(fā)明能夠明顯改善BERT預(yù)訓(xùn)練后模型的預(yù)測結(jié)果。