推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

面向移动图形顶点处理器的高性能低功耗定点特殊函数运算单元设计

更新时间:2019-09-06 07:44:18 大小:529K 上传用户:江岚查看TA发布的资源 浏览次数:163 下载积分:2分 出售积分赚钱 评价赚积分 ( 如何评价?) 标签:图形顶点处理器计算机算法 收藏 评论(0) 举报

资料介绍

摘 要:该文提出了一种应用于移动顶点处理器的高性能低功耗定点特殊函数运算单元电路。该运算单元支持嵌入

式图形标准OpenGL ES 1.X 的定点数据格式,并支持小数点后16 位精度的倒数、均方根、倒数均方根、对数和

指数等初等函数运算。初等函数采用分段二次多项式插值方法近似计算,系数处理中引入2 运算电路,相对于传

统的设计在相同的精度下使整体的二次多项式查找表大小减少了29%。优化二次多项式插值算法的计算误差和截

断误差,使电路的查找表大小、平方器、乘法器和加法器的面积、速度达到最优。该电路采用0.18 μm 的 CMOS

工艺实现,面积为0.112 mm2,芯片时钟频率达到300 MHz,功耗仅为12.8 mW。测试结果表明该定点特殊函数

运算单元非常适合移动图形顶点处理器的初等函数计算应用。


部分文件列表

文件名 大小
面向移动图形顶点处理器的高性能低功耗定点特殊函数运算单元设计.pdf 529K

部分页面预览

(完整内容请下载后查看)
33 卷第 11 期  
201111月  
Vol.33No.11  
Nov. 2011  
Journal of Electronics & Information Technology  
面向移动图形顶点处理器的高性能低功耗定点特殊函数运算单元设计  
焦继业*①  
刘有耀  
(西安电子科技大学宽带隙半导体材料与器件国家重点实验室 西安 710071)  
(西安科技大学网络中心 西安 710054)  
(西安邮电学院专用集成电路设计中心 西安 710061)  
该文提出了一种应用于移动顶点处理器的高性能低功耗定点特殊函数运算单元电路运算单元支持嵌入  
式图形标准 OpenGL ES 1.X 的定点数据格式,并支持小数点后 16 位精度的倒数、均方根、倒数均方根、对数和  
指数等初等函数运算。初等函数采用分段二次多项式插值方法近似计算,系数处理中引入 2 运算电路,相对于传  
统的设计在相同的精度下使整体的二次多项式查找表大小减少了 29%。优化二次多项式插值算法的计算误差和截  
断误差,使电路的查找表大小、平方器、乘法器和加法器的面积、速度达到最优。该电路采用 0.18 μm CMOS  
工艺实现,面积为 0.112 mm2,芯片时钟频率达到 300 MHz,功耗仅为 12.8 mW。测试结果表明该定点特殊函数  
运算单元非常适合移动图形顶点处理器的初等函数计算应用。  
关键词:图形顶点处理器;计算机算法;初等函数;多项式近似;定点计算;特殊函数运算单元  
中图分类号:TP302.1  
文献标识码: A  
文章编号:1009-5896(2011)11-2764-07  
DOI: 10.3724/SP.J.1146.2011.00480  
High Performance and Low Power Fixed-point Special  
Function Unit for Mobile Vertex Processors  
Jiao Ji-ye  
Mu Rong  
Hao Yue  
Liu You-yao  
(Key Laboratory of Ministry of Education for Wide BandGap Semiconductor Materials and Devices,  
Xidian University, Xian 710071, China)  
(Network Centor, Xian University of Science and Technology, Xian 710054, China)  
(The ASIC Design Center, Xian University of Posts and Telecommunications, Xian 710061, China)  
Abstract: A high performance and low power fix-point Special Function Unit (SFU) for mobile vertex processors is  
presented in this paper. The system supports the fix-point format for OpenGL ES 1.X and implements 16 bit  
precision after the decimal point and faithfully rounded reciprocal, square root, reciprocal square root, logarithm,  
and exponential functions. The functions are approximated by using a piecewise quadratic interpolation technique.  
A square root 2 circuit is used in the unit, and the lookup table size is reduced by 29% with respect to previously  
proposed techniques, without any loss in accuracy. Based on analysis result of computer error and truncate error,  
the speed and area of lookup table, square unit, multiplier and fused accumulation tree reach optimal. The SFU has  
been implemented in a0.18 μm CMOS technology. The circuit is able to operate up to 300 MHz clock frequency,  
with a power dissipation of 12.8 mW at 300 MHz and area only 0.112 mm2. The results show that the fixed-point  
SFU is ideal for mobile vertex processors computing elementary functions.  
Key words: Vertex processors; Computer arithmetic; Elementary functions; Polynomial approximation; Fixed-  
point computations; Special Function Unit (SFU)  
1 引言  
并且可以实现跳转态流数据处理等[1]因  
此,可编程图形处理器不仅需要实现加法和乘法运  
算,而且还要实现 3D 渲染中透视运算、向量归一  
量距离运算和光照计算的初等函数运算(如倒  
数,均方根,对数,指数和三角函数等)。在 GPU  
中用高速特殊函数运算单元(Special Function Unit,  
SFU)完成初等函数的计算。高端的桌面图形处理  
器,需要实现浮点的 SFU[13] 才能支持高速的、绚  
现代图形处理器(Graphics Processing Units,  
GPU)采用了各种可编程的着色处理器以采用任  
意方式完成 3D 渲染流水线中的顶点、像素计算,  
2011-05-09 收到,2011-07-22 改回  
陕西省自然科学基金 (2009JM8004)和教育部科学技术研究重点项  
(211180)资助课题  
*通信作者:焦继业

推荐下载

全部评论(0)

暂无评论