推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

FPGA深度学习中不同核的探索与权衡

更新时间:2019-01-16 11:06:20 大小:3M 上传用户:z00查看TA发布的资源 标签:fpga 下载积分:2分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

挑战1:不同的使用案例需要不同的网络和不同的优点数字速度,延迟,能量,准确性

挑战2:数十亿乘法累加运算和数十兆字节的参数数据运算符海,自定义数学和存储器层次结构

挑战3:不断推出新算法强化架构存在风险


嵌入式/低成本:

 -  Zynq(PYNQ,Zedboard,Snickerdoodle,Zybo)

 -  Snickerdoodle:Zynq 7010  - 双核ARM

•28K LUT,80个DSP,262KB RAM

 -  PYNQ:Zynq 7020  - 双核ARM

•85K LUT,220个DSP,612KB RAM

大型高性能:

 -  Virtex Ultrascale +(VCU1525,亚马逊F1等)

 -  Virtex Ultrascale + VU13P

•1.7M LUT,3.4M FF,45MB RAM

•12228 DSP(比Zynq 7010大153倍!)

 - 使用VU9P的AWS EC2:f1.16xlarge

•8个FPGA中的54720个DSP


部分文件列表

文件名 大小
s2_3.pdf 3M

全部评论(0)

暂无评论