模型部署方法、模型部署裝置、終端設(shè)備及可讀存儲介質(zhì)
基本信息

| 申請?zhí)?/td> | CN202110567899.5 | 申請日 | - |
| 公開(公告)號 | CN113220457A | 公開(公告)日 | 2021-08-06 |
| 申請公布號 | CN113220457A | 申請公布日 | 2021-08-06 |
| 分類號 | G06F9/50;G06N3/10;G06N3/08;G06N3/04 | 分類 | 計算;推算;計數(shù); |
| 發(fā)明人 | 李發(fā)兵;林偉偉;李想;毛興中 | 申請(專利權(quán))人 | 交叉信息核心技術(shù)研究院(西安)有限公司 |
| 代理機構(gòu) | 北京中巡通大知識產(chǎn)權(quán)代理有限公司 | 代理人 | 孟大帥 |
| 地址 | 710077 陜西省西安市高新區(qū)天谷八路軟件新城云匯谷156號B2座11層 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種模型部署方法、模型部署裝置、終端設(shè)備及可讀存儲介質(zhì),所述方法包括以下步驟:獲取待部署深度神經(jīng)網(wǎng)絡(luò)模型的算子模型集合;將算子模型集合中滿足預設(shè)條件的算子模型進行算子融合或算子分割處理,獲得處理后的算子模型集合;獲取所述處理后的算子模型集合中每個算子模型在用于部署模型的設(shè)備集合中的每個設(shè)備上的運行時間,獲得運行時間集合;基于所述運行時間集合,采用預設(shè)搜索方法對所述處理后的算子模型集合中的算子模型進行組合,獲得子模型集合;基于所述子模型集合,將待部署深度神經(jīng)網(wǎng)絡(luò)模型部署于所述設(shè)備集合上。本發(fā)明能夠充分兼容不同算力的設(shè)備,可提高運行效率以及全局上的吞吐率。 |





