推荐星级:
- 1
- 2
- 3
- 4
- 5
FPGA深度学习中不同核的探索与权衡
资料介绍
挑战1:不同的使用案例需要不同的网络和不同的优点数字速度,延迟,能量,准确性
挑战2:数十亿乘法累加运算和数十兆字节的参数数据运算符海,自定义数学和存储器层次结构
挑战3:不断推出新算法强化架构存在风险
嵌入式/低成本:
- Zynq(PYNQ,Zedboard,Snickerdoodle,Zybo)
- Snickerdoodle:Zynq 7010 - 双核ARM
•28K LUT,80个DSP,262KB RAM
- PYNQ:Zynq 7020 - 双核ARM
•85K LUT,220个DSP,612KB RAM
大型高性能:
- Virtex Ultrascale +(VCU1525,亚马逊F1等)
- Virtex Ultrascale + VU13P
•1.7M LUT,3.4M FF,45MB RAM
•12228 DSP(比Zynq 7010大153倍!)
- 使用VU9P的AWS EC2:f1.16xlarge
•8个FPGA中的54720个DSP
部分文件列表
文件名 | 大小 |
s2_3.pdf | 3M |
全部评论(0)