一種漸進(jìn)式的深度學(xué)習(xí)模型的超參數(shù)尋優(yōu)方法

基本信息

申請(qǐng)?zhí)?/td> CN202111002372.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113780575A 公開(kāi)(公告)日 2021-12-10
申請(qǐng)公布號(hào) CN113780575A 申請(qǐng)公布日 2021-12-10
分類號(hào) G06N20/00(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 都衛(wèi)東;方志斌;王巖松;和江鎮(zhèn);張中信;吳健雄 申請(qǐng)(專利權(quán))人 征圖智能科技(江蘇)有限公司
代理機(jī)構(gòu) 常州品益專利代理事務(wù)所(普通合伙) 代理人 王涵江
地址 211100江蘇省南京市江寧區(qū)東吉大道1號(hào)(江寧開(kāi)發(fā)區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種漸進(jìn)式的深度學(xué)習(xí)模型的超參數(shù)尋優(yōu)方法,包括:步驟一:生成多個(gè)不同的深度學(xué)習(xí)模型,并從超參數(shù)空間中為每一個(gè)模型選取一組超參數(shù);步驟二:在訓(xùn)練集上訓(xùn)練每一個(gè)模型一定的代數(shù),步驟三:對(duì)模型按照性能的高低從高到低進(jìn)行排序;采用逐次減半的方法,保留性能排名50%之前的模型;步驟四:在保留的模型中選取部分模型對(duì)模型的超參數(shù)進(jìn)行擾動(dòng);步驟五:繼續(xù)在訓(xùn)練集上訓(xùn)練每一個(gè)模型一定的代數(shù),步驟六:判斷是否滿足最大迭代次數(shù),如是則保存最優(yōu)的模型并終止訓(xùn)練至結(jié)束。采用這種逐次減半的方式訓(xùn)練的超參數(shù)尋優(yōu)方法,有利于使用更多的資源尋優(yōu)表現(xiàn)優(yōu)異的超參數(shù),減少了相似模型的重復(fù)訓(xùn)練,使模型得到更優(yōu)的性能。