推荐星级:
- 1
- 2
- 3
- 4
- 5
利用混合存储立方体提升基于FPGA的图形处理器的性能:广度优先搜索的一个案例
资料介绍
年来,大图处理因其从机器学习到社会科学的广泛适用性而备受关注。然而,大的真实图形本身难以有效地处理,这不仅是因为它们具有大的存储器占用,而且大多数图形算法需要具有较差的局部性和较低的计算 - 存储器访问比率的存储器访问模式。在这项工作中,我们利用新兴的混合存储器立方体(HMC)技术的卓越随机存取性能,该技术将多个DRAM芯片堆叠在逻辑层之上,并结合FPGA的灵活性和效率来应对这些挑战。据我们所知,这是第一项基于软件/硬件协同设计和协同优化在FPGA-HMC平台上实现图形处理系统的工作。我们首先介绍算法的修改和平台感知图处理架构,以在FPGA-HMC平台上执行级别同步广度优先搜索(BFS)。
为了更好地了解提议实施的潜在瓶颈,我们开发了一种分析性能模型,以定量评估HMC访问延迟和相应的BFS性能。基于该分析,我们提出了一种两级位图方案,以进一步减少存储器访问并对关键设计参数(例如,存储器访问粒度)执行优化。最后,我们使用Micron的AC-510开发套件评估我们的BFS实施的性能。我们在随机图表上使用GRAPH500基准测试获得了每秒1.66亿个边缘(MTEPS),其比例为25,边缘系数为16,显着优于CPU和其他基于FPGA的大型图形处理器。
部分文件列表
文件名 | 大小 |
1547601059JZhang_FPGA17_BFS.pdf | 579K |
全部评论(0)