一种端到端CNN加速器及剪枝模型压缩方法_论文专利--深圳清华大学研究院-微电子与智能技术实验室

【论文专利】

专利名称：一种端到端CNN加速器及剪枝模型压缩方法

专利国别：中国

专利号：202210289492.5

法律状态：实审

发明人：张沕琳，张超，唐紫健，仲雄

申请人：清华大学

地址：100084 北京市海淀区100084信箱82分箱清华大学专利办公室

申请日期：2022-03-23

授权日期：

摘要：

本发明提供了一种端到端CNN加速器及剪枝模型压缩方法，基于EEG评估持续注意力水平，方法包括：对CNN模型依次进行组卷积、全局平均池、近零剪枝、偏差驱动剪枝、权重聚类和量化步骤，得到压缩后的CNN模型；其中，所述CNN模型由四个卷积块、一个全局平均池化层和一个线性层组成，每个卷积块包括一维卷积层、一维批量归一化层和校正线性单元层。所述加速器由FPGA实现，具体包括：两两互相连接的控制器、片上块随机存取存储器、处理引擎阵列。本发明达到183.11倍的模型压缩比，在二元注意水平分类任务上达到了84.2％的独立于被试的准确率。本发明在FPGA上达到了0.11W的设计功耗和8.19GOps/W的能效。

专利证书 PDF/Jpg