- 1
- 2
- 3
- 4
- 5
FASTCF:基于FPGA的加速器,用于基于随机梯度下降的协同过滤
资料介绍
使用随机梯度下降(SGD)的稀疏矩阵分解是用于从观察中导出潜在特征的流行技术。 SGD广泛用于协同过滤(CF),它本身是推荐系统的着名机器学习技术。在本文中,我们开发了一个基于FPGA的加速器FASTCF,以加速基于SGD的CF算法。 FASTCF由并行的流水线处理单元组成,它们通过访问共享的片上缓冲区来同时处理不同的用户评级。我们通过对特定设计挑战的整体分析来设计FASTCF,以加速基于SGD的FPGA在FPGA上的应用。基于我们对这些设计挑战的分析,我们开发了一种二分图处理方法,该方法采用新颖的3级分层分区方案,可实现冲突最小化调度和处理片上特征向量数据,从而显着加速此二分图的处理。首先,我们开发了一种快速启发式方法,将输入图划分为诱导子图;这使FASTCF能够有效地缓冲顶点数据以便重用,并完全隐藏通信开销。其次,我们将每个子图的所有边分割成匹配以提取最大并行度。第三,我们安排在每个匹配内执行边缘,以减少与共享片上缓冲区的并发内存访问冲突。与非优化基线设计相比,分层分区方法可以减少高达60倍的数据依赖性,减少4.2倍的冲突,以及15.4倍的加速。我们基于最先进的FPGA实现FASTCF,并使用三个大型实际数据集评估其性能。实验结果表明,FASTCF每秒支持高达2170亿次浮点运算(GFLOPS)的高吞吐量。与最先进的多核和GPU实现相比,FASTCF分别展示了13.3倍和12.7倍的加速。
部分文件列表
文件名 | 大小 |
shijie-fpga-2018.pdf | 2M |
最新上传
-
21ic下载 打赏310.00元 1天前
用户:w178191520
-
21ic下载 打赏310.00元 1天前
用户:小猫做电路
-
21ic下载 打赏310.00元 1天前
用户:gsy幸运
-
21ic下载 打赏210.00元 1天前
用户:zhengdai
-
21ic下载 打赏210.00元 1天前
用户:jh0355
-
21ic下载 打赏210.00元 1天前
用户:jh03551
-
21ic下载 打赏210.00元 1天前
用户:xzxbybd
-
21ic下载 打赏70.00元 1天前
用户:铁蛋锅
-
21ic下载 打赏60.00元 1天前
用户:sun2152
-
21ic下载 打赏60.00元 1天前
用户:xuzhen1
-
21ic下载 打赏60.00元 1天前
用户:liqiang9090
-
21ic下载 打赏20.00元 1天前
用户:w1966891335
-
21ic下载 打赏30.00元 1天前
用户:玉落彼岸
-
21ic下载 打赏15.00元 1天前
用户:x15580286248
-
21ic下载 打赏15.00元 1天前
用户:kk1957135547
-
21ic下载 打赏15.00元 1天前
用户:w993263495
-
21ic下载 打赏30.00元 1天前
用户:SkyEagle88
-
21ic下载 打赏25.00元 1天前
用户:hp860629
-
21ic下载 打赏5.00元 1天前
用户:dong2223333
-
21ic下载 打赏10.00元 1天前
用户:dxb3320
-
21ic下载 打赏10.00元 1天前
用户:DXB193394
-
21ic下载 打赏10.00元 1天前
用户:westup
-
21ic小能手 打赏15.00元 2天前
-
21ic小能手 打赏20.00元 2天前
-
21ic小能手 打赏8.00元 2天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
资料:高频功率放大器设计
-
21ic小能手 打赏5.00元 3天前
资料:基于PID的双轮平衡车
-
21ic小能手 打赏10.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:w178191520
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic下载 打赏310.00元 3天前
用户:zhengdai
-
21ic下载 打赏220.00元 3天前
用户:gsy幸运
-
21ic下载 打赏220.00元 3天前
用户:jh0355
-
21ic下载 打赏210.00元 3天前
用户:jh03551
-
21ic下载 打赏60.00元 3天前
用户:sun2152
-
21ic下载 打赏60.00元 3天前
用户:xuzhen1
全部评论(0)