推荐星级:
- 1
- 2
- 3
- 4
- 5
FPGA能否加速下一代深度神经网络的GPU?
资料介绍
当前的深度神经网络(DNN),如AlexNet和VGG,严重依赖于密集浮点矩阵乘法(GEMM),它可以很好地映射到GPU(常规并行,高TFLOP / s)。因此,GPU被广泛用于加速DNN。目前的FPGA提供卓越的能效(Ops / Watt),但它们不能提供当今DNN上的GPU性能。在本文中,我们将研究即将到来的FPGA技术进步,DNN算法的快速创新,并考虑未来的高性能FPGA是否会优于下一代DNN的GPU。即将推出的英特尔®14纳米StratixTM 10 FPGA将拥有数千个硬浮点单元(DSP)和片上RAM(M20K存储器模块)。它们还将具有高带宽存储器(HBM)和改进的频率(HyperFlex™核心架构)。这些功能组合使FPGA原始浮点性能与GPU的距离相当。同时,DNN正在迅速发展。例如,利用稀疏性(例如,修剪)和紧凑数据类型(例如,1-2比特)的最新创新导致算法效率的重大飞跃。然而,这些创新在自定义数据类型上引入了不规则的并行性,这对GPU来说难以处理,但非常适合FPGA的极端可定制性。
部分文件列表
文件名 | 大小 |
1547185463fpga17-next-generation-dnns.pdf | 1M |
全部评论(0)