推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

IBPU:一种面向通用处理器架构的 比特置换功能单元

更新时间:2019-12-24 21:35:51 大小:2M 上传用户:守着阳光1985查看TA发布的资源 标签:ibpu通用处理器架构 下载积分:1分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

本文利用Inverse Butterfly网络拓扑结构的自路由特性,并结合分治策略,提出了一种能够硬件高速实现任意比特置的换选路算法.利用该算法能够在O(lg N)条指令内完成N-bit任意静态置换操作,在O(lg2N)条指令内完成N-bit任意动态置换操作.在此基础上,本文构造了一种新型比特置换单元-Permutation Unit based on Inverse Butterfly,IBPU.并将它在SMIC 65nm工艺下进行了逻辑综合,结果表明:与以往研究成果相比,本文提出的IBPU资源消耗降低了约32%,延迟降低了近30%.当完成静态置换操作时,其功能单元所消耗的代价最小,不超过以往设计的60%;当完成动态置换操作时,虽然消耗的代价较大,但其随置换位宽N的增加涨幅较小,因此具有较高的稳定性,其综合性能优势明显.


部分文件列表

文件名 大小
IBPU:一种面向通用处理器架构的_比特置换功能单元.pdf 2M

部分页面预览

(完整内容请下载后查看)
8
Vol. 46 No. 8  
Aug. 2018  
2018  
8
ACTA ELECTRONICA SINICA  
IBPU:  
一种向通用架构的  
能单  
1
2
1
3
3
, , , ,  
马 超 南梅 潘达杉 李 伟 戴紫彬  
( 1.  
( ) ,  
国家成电路 上海 设计中心 海  
201204; 2.  
大学成电国家重点实验海  
200433;  
3.  
信息工程大学 河南  
450000)  
:
Inverse Butterfly , ,  
网络拓扑结构的自路由策略 提出了一种现  
本文用  
2
O( lg N)  
作 在 指令成  
意比换选在  
O( lgN)  
N-bit  
指令成  
N-bit  
PU.  
,  
作 在此本文构一种型比元  
-Permutation Unit based on Inverse ButterflyIB-  
SMIC 65nm  
, : ,  
进行了综合 结果表明 研究成相比 本文提出的  
IBPU  
并将它在  
低了约  
60% ;  
32% ,  
延迟低了近  
30% .  
, ,  
能单计的  
态  
, , N , ,  
增加因此具有综合显  
:
Inverse Butterfly  
;
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
网络 策略 换选现  
0372-2112 ( 2018) 08-1960-09  
DOI: 10. 3969 /j. issn. 0372-2112. 2018. 08. 022  
:
TP393. 3  
:
A
:
文章编号  
文献标识码  
电子学报  
IBPU: A Bit Permutation Functional Unit for  
General-Purpose Processors  
1
2
3
3
MA Chao NAN Long-mei PAN Da-shanLI Wei DAI Zi-bin  
( 1. National High Performance Integrated Circuit Design CenterShanghai 201204China;  
2. State Key Lab of ASIC and SystemFudan UniversityShanghai 200433China;  
3. Information Engineering UniversityZhengzhouHenan 450000China)  
Abstract: In this papera new routing algorithm for arbitrary bit permutation operations is proposed combining with  
the divide and conquer strategy. The algorithm utilizes self-routing characteristics of the Inverse Butterfly Network. It can  
complete any N-bit fixed permutation in no more than O( lgN) instructionsand also can complete any N-bit dynamic permu-  
2
tation in no more than O( lg N) instructions. On this basisa new bit-permutation unit based on Inverse ButterflyIBPU is  
developed and synthesized in SMIC 65-nm process. The results show that our IBPU has less resource consumption which de-  
creased by about 32% and lower latency which reduced by nearly 30% compared with the similar designs. Moreoverwhen  
it performs fixed permutationthe cost of the functional unit is minimalwhich is not more than 60% of what was previously  
designed. When it performs dynamic permutationthough its cost is greaterthe cost has smaller increase accompanying with  
the increase of permutation width Nso it has higher stability and its comprehensive performance advantages are obvious.  
Key words: Inverse Butterfly Network; divide and conquer; permutation routing algorithm; hardware implementation  
,  
现 这制约能 因此 如  
1
引言  
提高作在中的行效率 为  
1]  
34]  
、 、  
处  
作在学  
了人研究的点  
2]  
N-bit  
领域广泛地应用 它能成  
的  
种 然通用理  
专用指令度比作  
前 比作在速的主要实方  
N!  
其结果有  
,  
基于级动网络 能力不同 将  
56]  
级动网络分为阻塞阻塞型两结构  
Benes ,  
阻塞网络 结构类  
效率往往需指令组  
表是  
: 2016-07-21;  
: 2017-11-14; :  
责任编辑 蓝红杰  
收稿日期  
修回日期  
:
基金项目 国家自然科学基金  
( No. 61404175)  
1961  
8
: IBPU:  
一种向通用架构能单元  
1213]  
2lgN-1  
1
N = 8-bit Inverse  
网络一由  
通过网络成  
复杂度较因  
交叉开成 理数据次  
题  
描述个  
N!  
Butterfly  
网络 由  
lgN =3 ,  
种任其  
级组到下依次为第一  
N/2  
.  
和第级有  
2
输入交叉开关  
, ,  
此 在实应用往往软件换选算  
( Switch) ,  
交叉开在  
1-bit  
Sel ,  
号  
作用下  
2-bit lgN ×  
输入数据交叉或网络有  
指令的方入到供  
现  
N/2  
7]  
lgN × N/2  
Benes  
网络使储  
交叉开现  
2
换 输入数据网  
i 1  
, ,  
要对架构进行于快速集  
2
-bit( i  
1 i lgN)  
为级≤ ≤  
以  
进行两两  
,  
它应用范围限 仅适用情  
分组关中 将所  
.  
当所指  
0, ,  
那么网络的数据输入数据 恒  
令运算结果可提时 该网络电必须止  
,  
后一或设那么余  
指令算结果进行软件信息  
lgN-1 N/2-bit  
网络则是两相互以  
, ,  
入到换 这将量  
的子网络 左边为  
sub-ibfly sub-ib-  
右边为  
2
.  
的重严重影响路性能 动阻塞网  
fly ,  
1
网络与网络的相同 小  
Inverse ButterflyOmegaBaseline  
如  
lgN  
级组  
Benes  
是  
网络的一数据次通过网络  
, ,  
成任网络数较短 拓扑结  
, ,  
规则 具有拓扑迭代因此广泛应用通用  
,  
架构计中 是  
Inverse Butter-  
fly.  
基于网络已经开出了能高效适的  
路由指令 如并指令  
( parallel bit extractionPEX) 、  
指令  
( parallel bit  
8]  
9]  
2009 Hilewitz  
Inverse Butterfly  
网络  
人率先将  
depositionPDEP)  
( bit groupGRP)  
特归指令  
10]  
入到通用内部单计中 一种型  
( bit rotationROT)  
移位指令  
为了强  
14]  
-
移位 元  
( ROT)  
传统移位指令  
架构能力 其应用范围  
Chang  
提出  
11]  
( GRP) 、  
取  
复杂指令特归类  
GRP  
了通过用  
指令成任案  
( PEX) 、  
入  
( PEDP)  
个架构下 并功  
相比阻塞网络的式 它选  
15]  
Intel  
2013  
Haswell  
中  
应用于  
年发的  
信息初始信息直接自于指令  
2014 Chang  
人结归并提出了一种利  
, ,  
架构于快速集  
GRP  
指令的方案 使其对置  
条  
,  
初始信息的计复杂度较软件承  
具有了络的 性  
, ,  
低了源开质上仍  
11]  
GRP  
指令初始信息的生成  
中  
复杂 软件的方生成  
Inverse Butterfly  
,  
作 因此 基于  
Inverse Butterfly  
网络设  
计一种能高效成任意  
指令对应架构个  
网络  
,  
能单换  
,  
路由法电因此 来  
作在中的计瓶颈 切  
, ,  
操  
-Inverse  
本文络  
支持  
Butterfly、  
提出了一种快速  
生成信息的法 与传统  
基于因 本文高效实究  
Inverse Butterfly  
Benes  
, , ,  
相比 复杂更低 算  
分而策略 基于  
, ,  
络的详细进而  
9]  
件电路直接献  
11]  
同  
Inverse Butterfly  
, ,  
相比 本文提出积  
提出一种个  
网络成  
法  
延迟有提综合显  
3
2
换操算法研究  
背景识  
Inverse Butterfly  
3. 1  
Inverse Butterfly  
网络理  
网络作为级动阻塞网络的一  
在  
、  
应用器 处器之的  
N-bit  
应用分策略首先个  
分  
信中 其结构性质法一学术研究  
N/2-bit  
然后迭代个  
的  

全部评论(0)

暂无评论