推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

传输触发架构的可编程神经网络处理器设计

更新时间:2020-01-01 20:08:13 大小:2M 上传用户:songhuahua查看TA发布的资源 标签:可编程神经网络 下载积分:1分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

卷积神经网络算法存在着算法结构多样和数据交换计算量大的问题.为此,提出了一种基于传输触发体系架构的可编程卷积神经网络处理器.系统采用多通道直接存储器访问通道、多端口存储器和专用池化数据通道组成数据传输网络解决了数据交换问题.实验表明,该系统在实现卷积神经网络的加速计算方面,虽然吞吐速率比并行流水线方案慢11%,但与之相比具备可编程、适应不同神经网络的特性,节省了46.5%硬件乘法器资源,比其他非流水线实现方案吞吐速率至少快40%.该方案具有系统并行度大、可编程、可在线配置和处理速度较高的特点.


部分文件列表

文件名 大小
传输触发架构的可编程神经网络处理器设计.pdf 2M

部分页面预览

(完整内容请下载后查看)
西安电子科技大学学报 自然科学版  
2018  
Au 018  
45  
4  
JORNAL F XIDIN UERY  
ꢀ ꢀ ꢀ  
96900400117  
传输触发架构程神经网络处理器设计  
欣 冉  
然  
明  
( ,  
西安电子科技大学 电子工程学院 陕西 西安  
710071  
,  
摘要 法结数据的问题 触  
多通道直接访通道 多端池  
据通道数据传输明 该系统在算方  
率比并线慢  
, 、 ,  
了  
%  
线快  
该方系统度大 编  
.  
%  
线点  
; ; ;  
关键词 络 并列  
文章编号  
1004001097  
ꢀꢀ  
中图分类号  
文献标识码  
332  
ꢀꢀ  
he reurark rocessor  
ꢀ ꢀ ꢀ ꢀ  
p g  
basei ererchtecture  
ꢀ ꢀ ꢀ ꢀ ꢀ  
gg  
, ,  
ZHran HANuan n  
ANon  nran  
ꢀ ꢀ  
Schoectreein Xid 10071 ina  
ꢀ ꢀ g  
ract onvlueurrkavhe robtructurert anamunf  
ꢀ ꢀ ꢀ  
datxchata ererchtecturaseonvlueurrk  
g  
ꢀ ꢀ ꢀ ꢀ ꢀ  
rocessoesenteatontructeth hannrect  
ꢀ ꢀ pp ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ -  
memr acceshanns thi oremr anzed ooin data ath olvehe  
p  
atxchaobntaesuhat ahe rserchtecturs  
p gp p  
hatretructure et oonvlueurrknd  
ꢀ ꢀꢀ  
save 4 red th the sch resented in other rs exc e  
ꢀ ꢀ ꢀ ꢀ pp  
p  
im nta ouoveathroat asides th as  
 ꢀ ꢀy  
y  
ibine archtecture recra h  
p g g  
advantf aranc  
p  
rocesin ed etꢀ  
g p  
Ke rds  
dee earnin convoluionaeurrks ara in ld e  
p g  
atrra  
g y  
较  
Convluurark NN  
网络  
高的准确率速在获得的  
LeNt  
算法有  
CNN  
[]  
: , ,  
用多使算法导致线并  
算法有点  
VGGt  
23  
, , ;  
满足配置数  
行加速方案  
[]  
, ,  
通信开销而且卷网络存在量算法导致通的矩阵速方消耗了大  
, , ,  
通信时提高速 算法提  
2018  
收稿日期  
网络出版时间  
2011  
- -  
ꢀꢀꢀꢀ  
作者简介 然  
199-  
),  
, ,  
西安电技大学究生  
haoboran2016 .  
g  
196-  
),  
ha id.  
@  
通信作者  
师  
/  
t  
/ /  
kn1076 T N 20171228 0918 006 ml  
网络出版地址  
/  
http dxet  
输触发架计  
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ  
93  
4  
6  
然  
Cenrarocesin PU  
了很速方法  
和一通用速方法  
通用中器  
, , ;  
能效比低 而且度低 路  
备  
ntatercuIC  
pp  
p  
, ;  
和 功 但 是 性 差 令 集 器  
nstrucrocessor  
pp  
p  
ꢀ ꢀ  
[ ]  
17  
IP  
程特为一嵌  
通用  
CPU  
具有可  
elra A  
式图现场可阵列  
重构想的  
关键编  
使用  
IP  
IP  
的体系和高效的网络 使不同类型和规模的网络具有笔  
; ,  
首先介绍网络体系后 介绍处路结单个单  
Procesin ElE  
使体系构  
anrechtecture  
g  
[ ]  
18  
TTA  
, )  
recemcess MA  
多通道直接访问  
通道 多端化  
、 ; ,  
路可高效的  
实验结果 网络的高速性  
卷积神经网络算法处理器体构  
型的  
网络  
1  
CNN  
网络层  
)、  
样层  
全连接  
Poin r  
Convlur  
y  
ꢀꢀ  
l conneter .998  
y  
献  
[]  
字识提出了  
个  
LeN5  
、 , ,  
样层 全连有卷输出为  
大  
2012  
中 提 出 了  
ImcalsuRC  
ꢀ  
规模挑 战 赛  
[]  
、 ,  
样层全连有  
输出图  
t  
35 1  
示  
28 19014  
献  
[]  
数量有  
提出的一种  
RC VGGt  
, ,  
的  
网络样层 全连和  
13  
VG6  
输出数量有  
sox  
可以网络点  
56 51.  
网络的  
的  
网络不同网络对应数量不同  
线算  
据交换操作  
网络结构图  
VG16  
处理器构  
2  
, :  
以上可知 网络要的构应具有大规模并行并且层  
; ,  
重复使用 在量数据交算 数据交可根据选择  
TTA  
on  
必 须 根 据 网 络 选 择  
长 指 字  
[ ]  
19  
Instrucrd W  
据  
tele  
体系而来的  
体系堆  
W  
而  
体系构将功能统通条  
据  
TTA  
ve  
对应操作现其功能  
体系比  
W  
集  
TA  
并且使络完见  
体系网络合  
TTA  
/  
http dxet  

全部评论(0)

暂无评论