- 1
- 2
- 3
- 4
- 5
FPGA能否加速下一代深度神经网络的GPU?
资料介绍
当前的深度神经网络(DNN),如AlexNet和VGG,严重依赖于密集浮点矩阵乘法(GEMM),它可以很好地映射到GPU(常规并行,高TFLOP / s)。因此,GPU被广泛用于加速DNN。目前的FPGA提供卓越的能效(Ops / Watt),但它们不能提供当今DNN上的GPU性能。在本文中,我们将研究即将到来的FPGA技术进步,DNN算法的快速创新,并考虑未来的高性能FPGA是否会优于下一代DNN的GPU。即将推出的英特尔®14纳米StratixTM 10 FPGA将拥有数千个硬浮点单元(DSP)和片上RAM(M20K存储器模块)。它们还将具有高带宽存储器(HBM)和改进的频率(HyperFlex™核心架构)。这些功能组合使FPGA原始浮点性能与GPU的距离相当。同时,DNN正在迅速发展。例如,利用稀疏性(例如,修剪)和紧凑数据类型(例如,1-2比特)的最新创新导致算法效率的重大飞跃。然而,这些创新在自定义数据类型上引入了不规则的并行性,这对GPU来说难以处理,但非常适合FPGA的极端可定制性。
部分文件列表
文件名 | 大小 |
1547185463fpga17-next-generation-dnns.pdf | 1M |
最新上传
-
21ic小能手 打赏15.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:kk1957135547
-
21ic下载 打赏310.00元 3天前
用户:zhengdai
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic下载 打赏310.00元 3天前
用户:gsy幸运
-
21ic下载 打赏310.00元 3天前
用户:liqiang9090
-
21ic下载 打赏160.00元 3天前
用户:w178191520
-
21ic下载 打赏210.00元 3天前
用户:jh035511
-
21ic下载 打赏150.00元 3天前
用户:jh03551
-
21ic下载 打赏40.00元 3天前
用户:cooldog123pp
-
21ic下载 打赏40.00元 3天前
用户:sun2152
-
21ic下载 打赏30.00元 3天前
用户:WK520077778
-
21ic下载 打赏60.00元 3天前
用户:1111111ffgg
-
21ic下载 打赏20.00元 3天前
用户:铁蛋锅
-
21ic下载 打赏20.00元 3天前
用户:小猪配二锅头
-
21ic下载 打赏20.00元 3天前
用户:w1966891335
-
21ic下载 打赏20.00元 3天前
用户:w993263495
-
21ic下载 打赏20.00元 3天前
用户:xzxbybd
-
21ic下载 打赏30.00元 3天前
用户:happypcb
-
21ic下载 打赏30.00元 3天前
用户:zzggq
-
21ic下载 打赏20.00元 3天前
用户:xuzhen1
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏20.00元 3天前
-
21ic小能手 打赏15.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic下载 打赏310.00元 3天前
用户:gsy幸运
-
21ic下载 打赏310.00元 3天前
用户:liqiang9090
-
21ic下载 打赏310.00元 3天前
用户:zhengdai
-
21ic下载 打赏160.00元 3天前
用户:w1966891335
-
21ic下载 打赏160.00元 3天前
用户:w178191520
-
21ic下载 打赏160.00元 3天前
用户:kk1957135547
-
21ic下载 打赏40.00元 3天前
用户:WK520077778
-
21ic下载 打赏40.00元 3天前
用户:sun2152
-
21ic下载 打赏30.00元 3天前
用户:xuzhen1
-
21ic下载 打赏50.00元 3天前
用户:铁蛋锅
全部评论(0)