智能體訓(xùn)練方法、跨域異構(gòu)環(huán)境任務(wù)調(diào)度方法及相關(guān)裝置

基本信息

申請?zhí)?/td> CN202210663848.7 申請日 -
公開(公告)號 CN114757352A 公開(公告)日 2022-07-15
申請公布號 CN114757352A 申請公布日 2022-07-15
分類號 G06N3/08(2006.01)I;G06N3/04(2006.01)I;G06N7/00(2006.01)I;G06F9/48(2006.01)I;G06F9/50(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 孫昌勇;楊談;王延巍;杜炯;鄭永伯 申請(專利權(quán))人 中科鏈安(北京)科技有限公司
代理機(jī)構(gòu) 北京金咨知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100027北京市東城區(qū)東直門外大街35號東湖別墅C座601
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N智能體訓(xùn)練方法、跨域異構(gòu)環(huán)境任務(wù)調(diào)度方法及相關(guān)裝置,智能體訓(xùn)練方法包括:獲取用于模擬真實(shí)的跨域異構(gòu)環(huán)境中任務(wù)負(fù)載的預(yù)訓(xùn)練數(shù)據(jù);根據(jù)預(yù)訓(xùn)練數(shù)據(jù)對深度強(qiáng)化學(xué)習(xí)智能體進(jìn)行訓(xùn)練,以使深度強(qiáng)化學(xué)習(xí)智能體用于對針對跨域異構(gòu)環(huán)境進(jìn)行任務(wù)調(diào)度,其中,深度強(qiáng)化學(xué)習(xí)智能體預(yù)先基于D3QN模型和跨域異構(gòu)環(huán)境的任務(wù)調(diào)度問題對應(yīng)的馬爾可夫決策過程構(gòu)建而得。本申請能夠構(gòu)建一種兼顧任務(wù)調(diào)度實(shí)時性和高效性的智能體,能夠有效提高應(yīng)用該智能體進(jìn)行跨域異構(gòu)環(huán)境中任務(wù)調(diào)度的時效性,能夠增加整個任務(wù)調(diào)度系統(tǒng)的吞吐量并最大化利用跨域環(huán)境中提供的計算資源,以保證任務(wù)調(diào)度的結(jié)果兼顧任務(wù)處理的高效性和計算節(jié)點(diǎn)之間的負(fù)載均衡性。