推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

数据中心中路由编码的可行性研究

更新时间:2019-12-25 05:37:28 大小:2M 上传用户:zhiyao6查看TA发布的资源 标签:数据中心 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

修复带宽最优并不代表修复通信量也是最优的,后者与物理网络拓扑有着密切联系.本文基于路由编码的思想减少修复通信量.首先,基于信息流图对物理网络中数据的传递过程进行建模,证明得出了满足路由编码可行的充要条件,并发现路由编码可以基于再生码实现.然后,针对数据中心网络设计的特点,为Fat-tree设计了一个工作在应用层的协议来生成修复树,为CamCube设计了一个启发式算法来生成修复树.关于最小存储再生码的数据修复过程的仿真实验表明,路由编码可以有效地降低修复通信量,2种修复树生成方案在各自适合的网络中均有较好性能:在帮助节点数较小时,Fat-tree和CamCube中的修复通信量分别降低了大约50%和30%.


部分文件列表

文件名 大小
数据中心中路由编码的可行性研究.pdf 2M

部分页面预览

(完整内容请下载后查看)
11 期  
ꢀ  
ꢀ  
ꢀ  
Vol.45ꢀ No.11  
Nov.ꢀ 2017  
2017 11 月  
ACTA ELECTRONICA SINICA  
数据中心中路由编码的可行性研究  
丁炳辰李卫忠唐永康2  
(1.空军工程大学防空反导学院陕西西安 710051; 2.国防科学技术大学计算机学院湖南长沙 410073)  
ꢀ ꢀ 修复带宽最优并不代表修复通信量也是最优的后者与物理网络拓扑有着密切联系本文基于路由编  
码的思想减少修复通信量首先基于信息流图对物理网络中数据的传递过程进行建模证明得出了满足路由编码可  
行的充要条件并发现路由编码可以基于再生码实现然后针对数据中心网络设计的特点Fat⁃tree 设计了一个工  
作在应用层的协议来生成修复树CamCube 设计了一个启发式算法来生成修复树关于最小存储再生码的数据修复  
过程的仿真实验表明路由编码可以有效地降低修复通信量,2 种修复树生成方案在各自适合的网络中均有较好性  
在帮助节点数较小时,Fat⁃tree CamCube 中的修复通信量分别降低了大约 50%30%.  
关键词数据中心物理网络修复带宽修复通信量再生码  
中图分类号ꢀ TP302ư 8ꢀ ꢀ ꢀ 文献标识码ꢀ Aꢀ ꢀ ꢀ 文章编号ꢀ 0372⁃2112 (2017)11⁃2742⁃12  
电子学报 URLhttp/ / ww.ejournal.org.cnꢀ  
DOI: 10.396 .issn.0372⁃2112.2017.11.023  
Feasibility Study of Routing Codes in Datacenters  
DING Bing⁃chen,LI Wei⁃zhong,TANG Yong⁃kang2  
(1.Air and Missile Defense CollegeAir Force Engineering UniversityXianShaanxi 710051,China;  
.College of ComputerNational University of Defense TechnologyChangshaHunan 410073,China)  
Abstract:ꢀ Repair traffic is not always optimal when repair bandwidth is optimal.The former is relative to physical net⁃  
work topology.This paper aimed at reducing repair traffic based on routing codes. Firstwe modeled data transmission in  
physical networks based on information flow graph so that we could get the necessary and sufficient condition to feasibility  
of routing codes.And we found that routing codes could be realized based on regenerating codes.Thenwe designed a proto⁃  
col working on application layers to generate repair trees in Fat⁃treeand a heuristic algorithm to generate repair trees in  
CamCubewhich were both in agreement with their own design features of datacenter networks.Simulations about data⁃repair  
processes in systems using minimum⁃storage regenerating codes show that routing codes can reduce repair traffic efficiently,  
and performance of the two generation schemes of repair trees are both good in their own adapted networksn factrepair  
traffic had about 50% and 30% reductions in Fat⁃tree and CamCube respectively when the number of providers was small.  
Key words:ꢀ datacenterphysical networksrepair bandwidthrepair trafficregenerating codes  
的复制方式已难以适应数据中心对磁盘利用率和容错  
能力的需求[1] 纠删码rasure codes[2] 以其高存储利  
1ꢀ 引言  
ꢀ ꢀ 数据中心可以形成规模化效应即较大的数据中  
心有更低的单位成本所以数据中心通常包含上千台  
到上百万台的服务器对于这种规模的服务器集群由  
软件或硬件故障引起的存储节点离线数据丢失等统  
称为节点失效已成为一种常态而大型分布式存储系  
统的可靠性是数据中心的基础因此数据中心需要存  
储冗余数据来提高可靠性.  
用率和容错能力的优势得到越来越广泛的关注与应  
[3] 但是传统的纠删码有较高的修复代价[4,5] 例如,  
Facebook Analytics Hadoop cluster 对所存储的总数据的  
8%使用了 Reed⁃solomon 编码而这 8%的数据产生的修  
复通信量占了总网络通信量的将近 20%[6] 这也成为了  
传统纠删码没有被存储系统广泛采用的主要原因.  
Dimakis 等 人[7] 提 出 的 再 生 码 ( regenerating  
codes[8] 达到了单节点存储容量与单节点修复带宽e⁃  
随着数据中心的数据量以指数的趋势增长单  
收稿日期:2016⁃08⁃01;修回日期:2016⁃12⁃07;责任编辑马兰英  
ꢀ 11ꢀ 期  
丁炳辰数据中心中路由编码的可行性研究  
2743  
pair bandwidth的最优折衷ptimal tradeoff通过连接  
更多的帮助节点降低了修复带宽虽然再生码有最优的  
修复带宽但并不意味着修复通信量( repair traffic) 也  
是最优的文献[7]基于星型逻辑网络进行分析每个帮  
助节点与新节点直接相连距离为 此时的修复带  
宽等于修复通信量但这是理想化的实际中帮助节点  
与新节点之间的距离往往不止 .Zeng 等人[9] 考虑了  
物理网络拓扑和路由器对修复时间和修复通信量的影  
提出了路由器执行编码操作的思想使得路由器输  
出的数据量小于输入的数据量但是没有讨论路由器  
中编码方式的可行性.Zhang 等人[10] 也考虑了物理网络  
拓扑对修复通信量的影响但是仅基于最大距离可分  
aximum distance separable,MDS编码没有考虑帮助  
节点的增加对编码的可行性及修复通信量的影响.  
本文围绕降低修复通信量的问题出了修复带  
宽与修复通信量的差别修复带宽仅仅是修复过程中  
帮助节点生成的修复数据总量它是修复通信量的下  
后者受数据中心的物理网络拓扑的影响本文贡献  
有以下几点:  
Facebook warehouse cluster 单节点修复通常占 98%  
以上[3,11] 因此本文仅考虑单节点失效情形.  
定义  
(1)新节点替代失效节点的可用的存储节点失效  
节点上的数据需要在该节点上得以恢复.  
(2)帮助节点利用本地存储的数据帮助新节点恢  
复丢失数据的存储节点.  
(3)修复数据修复过程中帮助节点利用本地相关  
数据生成的用于修复的数据.  
(4)修复带宽所有修复数据的数据总量记为 γ.  
(5)修复通信量所有修复数据经过网络中实际的  
链路最终到达新节点时产生的通信总量记为 γ.  
根据定义 1,当帮助节点与新节点间距离均为 跳  
γγ.但这是理想化的物理网络中帮助节点与新节  
点之间的距离往往不止 因此γ γ的下界.  
2.1ꢀ 数据中心网络  
数据中心的关键设计是集群中所有服务器之间的  
互联网络其网络设计必须满足 个特殊要求低延迟、  
高带宽低成本消息传递接口通信支持和容错[12] 在  
数据中心中的任何两个服务器节点间应该建立多个路  
并通过在冗余服务器之间复制数据和计算来实  
现服务器容错不应该存在会将整个系统拖垮的单点  
路径单 点故据中心的网 络 主 要 有 种 设 计  
方式:  
(1)将信息流图( information flow graph) 型拓展  
到更一般的情形即物理网络中有中间节点的树状结  
通过分析证明得出了满足路由编码可行的充要条  
中间节点输出数据量的下界以及存储量与修复  
带宽的最优折衷.  
(2)为两种设计方式不同的数据中心网络Fat⁃  
tree CamCube分别设计了修复树的生成方案.  
(1)以交换机为中心交换机用于连接服务器服  
务器不需要做任何修改比如典型的 Fat⁃tree3] 如图 1  
所示服务器节点都在底层边缘交换机用于连接  
服务器节点集群化交换机边缘交换机和它们的叶节  
点服务器构成一个集装器核心交换机提供不同集装  
器间的路径胖树结构在任何两个服务器之间提供了多  
条路径相应的路由表也提供了额外的路由路径.  
2ꢀ 准备工作  
ꢀ ꢀ 相比容易发生节点暂时离线的对等分布式存储系  
数据中心中节点的规划都是良好的发生单节点失  
概 率 远 高 于 发 生 多 节 点 失 效 的 概 例 如 在  
ꢀ ꢀ (2)以服务器为中心该设计会修改运行在服务器  
上的操作系统使用特殊的驱动程序来转发网络数据  
仍需要组织交换机来实现互连BCube[14,15] .Costa  
等人[16] 进一步强化服务器在网络中的角色提出了一  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载