一種基于TVM的NPU神經(jīng)網(wǎng)絡(luò)模型部署方法及裝置
基本信息

| 申請?zhí)?/td> | CN202210482702.2 | 申請日 | - |
| 公開(公告)號(hào) | CN114721670A | 公開(公告)日 | 2022-07-08 |
| 申請公布號(hào) | CN114721670A | 申請公布日 | 2022-07-08 |
| 分類號(hào) | G06F8/60(2018.01)I;G06F8/41(2018.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N3/063(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
| 發(fā)明人 | 賈豐榮;蔡萬偉;陳寧 | 申請(專利權(quán))人 | 深圳云天勵(lì)飛技術(shù)股份有限公司 |
| 代理機(jī)構(gòu) | 北京三聚陽光知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | - |
| 地址 | 518000廣東省深圳市龍崗區(qū)園山街道龍崗大道8288號(hào)深圳大運(yùn)軟件小鎮(zhèn)17棟1樓 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請?zhí)峁┮环N基于TVM的NPU神經(jīng)網(wǎng)絡(luò)模型部署方法及裝置,包括:獲取待部署的神經(jīng)網(wǎng)絡(luò)模型和當(dāng)前NPU的硬件屬性信息;根據(jù)神經(jīng)網(wǎng)絡(luò)模型的計(jì)算邏輯,確定待部署到當(dāng)前NPU的卷積算子;根據(jù)當(dāng)前NPU的硬件屬性信息和各卷積算子的參數(shù)信息,確定各卷積算子在當(dāng)前NPU中的最優(yōu)參數(shù)配置;根據(jù)最優(yōu)參數(shù)配置和當(dāng)前NPU的硬件屬性信息,調(diào)整tir層的數(shù)據(jù)布局和卷積權(quán)重,對relay層的參數(shù)進(jìn)行修改,得到適配當(dāng)前NPU的目標(biāo)TVM;基于目標(biāo)TVM,生成神經(jīng)網(wǎng)絡(luò)模型適用于當(dāng)前NPU的部署文件。通過對TVM的tir層和relay層進(jìn)行相應(yīng)的參數(shù)調(diào)整,以使得到的目標(biāo)TVM能夠適配該NPU。 |





