推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

FPGA能否加速下一代深度神经网络的GPU?

更新时间:2019-01-11 13:47:50 大小:1M 上传用户:z00查看TA发布的资源 标签:fpga神经网络gpu 下载积分:2分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

当前的深度神经网络(DNN),如AlexNet和VGG,严重依赖于密集浮点矩阵乘法(GEMM),它可以很好地映射到GPU(常规并行,高TFLOP / s)。因此,GPU被广泛用于加速DNN。目前的FPGA提供卓越的能效(Ops / Watt),但它们不能提供当今DNN上的GPU性能。在本文中,我们将研究即将到来的FPGA技术进步,DNN算法的快速创新,并考虑未来的高性能FPGA是否会优于下一代DNN的GPU。即将推出的英特尔®14纳米StratixTM 10 FPGA将拥有数千个硬浮点单元(DSP)和片上RAM(M20K存储器模块)。它们还将具有高带宽存储器(HBM)和改进的频率(HyperFlex™核心架构)。这些功能组合使FPGA原始浮点性能与GPU的距离相当。同时,DNN正在迅速发展。例如,利用稀疏性(例如,修剪)和紧凑数据类型(例如,1-2比特)的最新创新导致算法效率的重大飞跃。然而,这些创新在自定义数据类型上引入了不规则的并行性,这对GPU来说难以处理,但非常适合FPGA的极端可定制性。

部分文件列表

文件名 大小
1547185463fpga17-next-generation-dnns.pdf 1M

全部评论(0)

暂无评论