一種神經(jīng)網(wǎng)絡模型的量化方法及裝置

基本信息

申請?zhí)?/td> CN202010290732.4 申請日 -
公開(公告)號 CN111563589A 公開(公告)日 2020-08-21
申請公布號 CN111563589A 申請公布日 2020-08-21
分類號 G06N3/08(2006.01)I 分類 -
發(fā)明人 梁寬濤 申請(專利權)人 中科物棲(北京)科技有限責任公司
代理機構 北京和信華成知識產(chǎn)權代理事務所(普通合伙) 代理人 胡劍輝
地址 100086北京市海淀區(qū)科學院南路6號中國科學院計算技術研究所科研綜合樓12層1248室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例涉及一種神經(jīng)網(wǎng)絡模型的量化方法及裝置,所述方法包括:在第一約束條件下確定神經(jīng)網(wǎng)絡模型每一層的第一量化位寬,第一約束條件依賴指定的電阻隨機存取存儲器ReRAM加速器的資源設置;針對神經(jīng)網(wǎng)絡模型的每一層,依據(jù)該層的第一量化位寬對該層的權重進行量化并將量化結果映射至ReRAM加速器,以及依據(jù)映射結果確定該層對應的第二約束條件;針對神經(jīng)網(wǎng)絡模型的每一層,對該層中的權重進行分塊,針對每一分塊,在該層對應的第二約束條件下確定該分塊的第二量化位寬,并依據(jù)第二量化位寬對該分塊中的權重進行量化。由此,可以實現(xiàn)最終確定出的量化方案既可以使得ReRAM加速器的資源利用率最高,又可以使得量化之后的神經(jīng)網(wǎng)絡模型的精度最高。??