一種神經(jīng)網(wǎng)絡模型的量化方法及裝置
基本信息

| 申請?zhí)?/td> | CN202010290732.4 | 申請日 | - |
| 公開(公告)號 | CN111563589A | 公開(公告)日 | 2020-08-21 |
| 申請公布號 | CN111563589A | 申請公布日 | 2020-08-21 |
| 分類號 | G06N3/08(2006.01)I | 分類 | - |
| 發(fā)明人 | 梁寬濤 | 申請(專利權)人 | 中科物棲(北京)科技有限責任公司 |
| 代理機構 | 北京和信華成知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 胡劍輝 |
| 地址 | 100086北京市海淀區(qū)科學院南路6號中國科學院計算技術研究所科研綜合樓12層1248室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明實施例涉及一種神經(jīng)網(wǎng)絡模型的量化方法及裝置,所述方法包括:在第一約束條件下確定神經(jīng)網(wǎng)絡模型每一層的第一量化位寬,第一約束條件依賴指定的電阻隨機存取存儲器ReRAM加速器的資源設置;針對神經(jīng)網(wǎng)絡模型的每一層,依據(jù)該層的第一量化位寬對該層的權重進行量化并將量化結果映射至ReRAM加速器,以及依據(jù)映射結果確定該層對應的第二約束條件;針對神經(jīng)網(wǎng)絡模型的每一層,對該層中的權重進行分塊,針對每一分塊,在該層對應的第二約束條件下確定該分塊的第二量化位寬,并依據(jù)第二量化位寬對該分塊中的權重進行量化。由此,可以實現(xiàn)最終確定出的量化方案既可以使得ReRAM加速器的資源利用率最高,又可以使得量化之后的神經(jīng)網(wǎng)絡模型的精度最高。?? |





