当前位置:网站首页 > 论文专利 >专利
【论文专利】

专利名称:一种端到端CNN加速器及剪枝模型压缩方法

专利国别:中国

专利号:202210289492.5

法律状态:实审

发明人:张沕琳,张超,唐紫健,仲雄

申请人:清华大学

地址:100084 北京市海淀区100084信箱82分箱清华大学专利办公室

申请日期:2022-03-23

授权日期:

摘要:

本发明提供了一种端到端CNN加速器及剪枝模型压缩方法,基于EEG评估持续注意力水平,方法包括:对CNN模型依次进行组卷积、全局平均池、近零剪枝、偏差驱动剪枝、权重聚类和量化步骤,得到压缩后的CNN模型;其中,所述CNN模型由四个卷积块、一个全局平均池化层和一个线性层组成,每个卷积块包括一维卷积层、一维批量归一化层和校正线性单元层。所述加速器由FPGA实现,具体包括:两两互相连接的控制器、片上块随机存取存储器、处理引擎阵列。本发明达到183.11倍的模型压缩比,在二元注意水平分类任务上达到了84.2%的独立于被试的准确率。本发明在FPGA上达到了0.11W的设计功耗和8.19GOps/W的能效。

专利证书 PDF/Jpg