推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

面向TTA架构ASIP设计的深度神经网络优化

更新时间:2019-11-15 14:10:34 大小:11M 上传用户:sun2152查看TA发布的资源 浏览次数:31 下载积分:0分 下载次数:1 次 标签:TTA架构ASIP深度神经网络 出售积分赚钱 评价赚积分 ( 如何评价?) 收藏 评论(0) 举报

资料介绍

量化与加速是深度神经网络硬件实现时常用的两项技术,卷积神经网络是最有代表性和最通用的深度神经网络。本文的主要工作即围绕这两项技术,进行面向TTA架构ASIP设计的卷积神经网络的优化,具体内容包含以下两个部分:

其一,本文针对基于TTA架构的神经网络ASIP的需求,提出了一套端到端完整的8比特量化方案。该方案结合权重、激活值和梯度的各自特点,为它们制定了相应的量化策略,包括了对称仿射的权重量化、带动态上限的激活值量化、变精度的梯度量化以及一种近似的批量归一化算法。在多数据集、多模型结构的实验中,该方案都取得了与全精度网络相当的精度,领先于部分当下常用的量化方案。其二,本文将查找表资源融入到卷积运算中,提出了一种基于乘法结合律的卷积运算的加速方案。该方案针对面向TTA架构的量化卷积功能单元,提供了符合量化卷积特性的卷积核分块、循环展开、数据交换规则,并展示了基于TTA架构的神经网络加速器的整体结构。对比传统卷积方案,该方案缓解了有限的乘法器资源对于神经网络并行计算的限制,在并行度与计算能效比两方面都有所提升。本文中,量化方案是加速方案的基础,加速方案是量化方案的补充,二者共同构成了本文的优化工作,为基于TTA架构的深度神经网络的ASIP实现提供了支持。


部分文件列表

文件名 大小
面向TTA架构ASIP设计的深度神经网络优化.pdf 11M

推荐下载

全部评论(0)

暂无评论