一種基于CUDA的GPU資源調(diào)度系統(tǒng)和方法

基本信息

申請?zhí)?/td> CN201910724239.6 申請日 -
公開(公告)號 CN110471766A 公開(公告)日 2019-11-19
申請公布號 CN110471766A 申請公布日 2019-11-19
分類號 G06F9/50(2006.01)I; G06T1/20(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 蘇斌 申請(專利權(quán))人 北京華恒盛世科技有限公司
代理機構(gòu) 北京科億知識產(chǎn)權(quán)代理事務所(普通合伙) 代理人 北京華恒盛世科技有限公司
地址 100013 北京市東城區(qū)和平里東街雍和航星科技園37號樓211室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于CUDA的GPU資源調(diào)度系統(tǒng),管理節(jié)點和系統(tǒng)用戶,所述系統(tǒng)用戶通過提交作業(yè)模塊連接到管理節(jié)點,所述管理節(jié)點通過派發(fā)作業(yè)模塊連接有IBM Power計算節(jié)點和NVDIA DGX計算節(jié)點。本發(fā)明針對不同類型的應用采用不同的GPU特性,提高整個系統(tǒng)中GPU的利用率,加速應用在GPU中的運行效率。系統(tǒng)可以針對應用需求,動態(tài)切換GPU模式,根據(jù)應用需要選擇最適合應用的GPU類型及其需要的GPU Factor,同一用戶多個應用可通過GPU MPS以獨占的方式共享使用GPU,提高GPU利用率,支持IBM Power和NVIDIA DGX兩種GPU NVLINK拓撲,將應用分配到帶有NVLINK互聯(lián)的GPU上,通過把當前GPU的主要特性應用于資源調(diào)度系統(tǒng)中,提高了這個系統(tǒng)的GPU資源利用率以及應用的運行效率。