专利名称:一种端到端CNN加速器及剪枝模型压缩方法
专利国别:中国
专利号:202210289492.5
法律状态:实审
发明人:张沕琳,张超,唐紫健,仲雄
申请人:清华大学
地址:100084 北京市海淀区100084信箱82分箱清华大学专利办公室
申请日期:2022-03-23
授权日期:
摘要:
本发明提供了一种端到端CNN加速器及剪枝模型压缩方法,基于EEG评估持续注意力水平,方法包括:对CNN模型依次进行组卷积、全局平均池、近零剪枝、偏差驱动剪枝、权重聚类和量化步骤,得到压缩后的CNN模型;其中,所述CNN模型由四个卷积块、一个全局平均池化层和一个线性层组成,每个卷积块包括一维卷积层、一维批量归一化层和校正线性单元层。所述加速器由FPGA实现,具体包括:两两互相连接的控制器、片上块随机存取存储器、处理引擎阵列。本发明达到183.11倍的模型压缩比,在二元注意水平分类任务上达到了84.2%的独立于被试的准确率。本发明在FPGA上达到了0.11W的设计功耗和8.19GOps/W的能效。
专利证书
PDF/Jpg