推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于深度稀疏自动编码器的社区发现算法

更新时间:2019-12-30 03:52:30 大小:1M 上传用户:zhiyao6查看TA发布的资源 标签:深度稀疏自动编码器 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

社区结构是复杂网络的重要特征之一,社区发现对研究网络结构有重要的应用价值.k-均值等经典聚类算法是解决社区发现问题的一类基本方法.然而,在处理网络的高维矩阵时,使用这些经典聚类方法得到的社区往往不够准确.提出一种基于深度稀疏自动编码器的社区发现算法CoDDA(a community detection algorithm based on deep sparse autoencoder),尝试提高使用这些经典方法处理高维邻接矩阵进行社区发现的准确性.首先,提出基于跳数的处理方法,对稀疏的邻接矩阵进行优化处理,得到的相似度矩阵不仅能够反映网络拓扑结构中相连节点间的相似关系,同时还反映了不相连节点间的相似关系.然后,基于无监督深度学习方法构建深度稀疏自动编码器,对相似度矩阵进行特征提取,得到低维的特征矩阵.与邻接矩阵相比,特征矩阵对网络拓扑结构有更强的特征表达能力.最后,使用k-均值算法对低维特征矩阵聚类得到社区结构.实验结果显示:与6种典型的社区发现算法相比,Co DDA算法能够发现更准确的社区结构.同时,参数实验结果显示,Co DDA算法发现的社区结构比直接使用高维邻接矩阵的基本k-均值算法发现的社区结构更为准确.


部分文件列表

文件名 大小
基于深度稀疏自动编码器的社区发现算法.pdf 1M

部分页面预览

(完整内容请下载后查看)
软件学报 ISSN 1000-9825, CODEN RUXUEW  
Journal of Software,2017,28(3):648-662 [doi: 10.13328/j.cnki.jos.005165]  
©中国科学院软件研究所版权所有.  
E-mail:  
Tel: +86-10-62562563  
基于深度稀疏自动编码器的社区发现算法∗  
尚敬文  
,
王朝坤  
,
,
(清华大学 软件学院,北京 100084)  
通讯作者: 王朝坤, E-mail:  
摘 要: 社区结构是复杂网络的重要特征之一,社区发现对研究网络结构有重要的应用价值.k-均值等经典聚类算  
法是解决社区发现问题的一类基本方法.然而,在处理网络的高维矩阵时,使用这些经典聚类方法得到的社区往往不  
够准确.提出一种基于深度稀疏自动编码器的社区发现算法 CoDDA(a community detection algorithm based on deep  
sparse autoencoder),尝试提高使用这些经典方法处理高维邻接矩阵进行社区发现的准确性.首先,提出基于跳数的处  
理方法,对稀疏的邻接矩阵进行优化处理,得到的相似度矩阵不仅能够反映网络拓扑结构中相连节点间的相似关系,  
同时还反映了不相连节点间的相似关系.然后,基于无监督深度学习方法构建深度稀疏自动编码器,对相似度矩阵进  
行特征提取,得到低维的特征矩阵.与邻接矩阵相比,特征矩阵对网络拓扑结构有更强的特征表达能力.最后,使用 k-  
均值算法对低维特征矩阵聚类得到社区结构.实验结果显示:6 种典型的社区发现算法相比,CoDDA 算法能够发  
现更准确的社区结构.同时,参数实验结果显示,CoDDA 算法发现的社区结构比直接使用高维邻接矩阵的基本 k-均  
值算法发现的社区结构更为准确.  
关键词: 社区发现;深度学习;CoDDA;s-;深度稀疏自动编码器  
中图法分类号: TP311  
中文引用格式: 敬文,朝坤,,.于深度稀疏自动编码器的社区发现算法.件学报,2017,28(3):648-662.  
英文引用格式: Shang JW, Wang CK, Xin X, Ying X. Community detection algorithm based on deep sparse autoencoder. Ruan  
Jian Xue Bao/Journal of Software, 2017,28(3):648-
Community Detection Algorithm Based on Deep Sparse Autoencoder  
SHANG Jing-Wen, WANG Chao-Kun, XIN Xin, YING Xiang  
(School of Software, Tsinghua University, Beijing 100084, China)  
Abstract: Community structure is one of the most important features of complex network. Community detection is of great significance  
in exploring the network structure. Classical clustering algorithms such as k-means are the basic methods for community detection.  
However, the detection results are often not accurate enough when dealing with high-dimensional matrix when using these classical  
methods. In this study, a community detection algorithm based on deep sparse autoencoder (CoDDA) is proposed to improve the accuracy  
of community detection using high-dimensional adjacent matrix with the classical methods. First, a hop-based operation for sparse  
adjacent matrix is provided to obtain the similarity matrix, which can express not only the relations between nodes that are linked but also  
the relations between nodes that are not linked. Then, a deep sparse autoencoder based on unsupervised deep learning methods is designed  
to extract the features of similarity matrix and obtain the low-dimensional feature matrix which can represent the features of network  
topology better than similarity matrix. Finally, k-means is used to identify the communities according to the feature matrix. Experimental  
results show that CoDDA can obtain more accurate communities than the six baseline methods. Besides, the parameter analysis indicates  
基金项目: 国家自然科学基金(61373023)  
Foundation item: National Natural Science Foundation of China (61373023)  
收稿时间: 2016-07-31; 修改时间: 2016-09-14; 采用时间: 2016-11-01; jos 在线出版时间: 2016-11-29  
CNKI 网络优先出版: 2016-11-29 13:35:13, http://www.cnki.net/kcms/detail/11.2560.TP.20161129.1335.017.html  
尚敬文 等:基于深度稀疏自动编码器的社区发现算法  
649  
that CoDDA can result in more accurate communities than the k-means algorithm which finds the communities according to the  
high-dimensional matrix directly.  
Key words: community detection; deep learning; CoDDA; s-hop; deep sparse autoencoder  
复杂网络是由大量节点以及节点之间错综复杂的关系共同构成的网络结构[1,2].除了小世界和无标度等特  
性外,复杂网络还呈现出明显的社区结构.所谓社区(community),是指网络中的节点聚集而成的子图.同一社区  
的节点之间连接紧密,不同社区的节点之间连接稀疏[1,3].1 所示的示例网络包含 3 个社区(虚线框出),其中,相  
同颜色的节点属于同一社区.现实世界的许多网络都具有社区结构,例如:在社交网络中,人与人之间建立朋友  
关系,形成了不同类型的朋友圈;在学术合作网络中,研究者们共同发表学术著作,形成各个研究领域的学术圈;  
在蛋白质网络中,蛋白质之间频繁地交互,形成了结构单元.于是,近年来,复杂网络中的社区发现问题得到社会  
物学与计算机科学等多个学科的广泛关注和深入研究[1,4-6],社区发现的研究成果也被成功应用于诸如好  
友推荐、个性化商品推介、蛋白质功能预测、舆情分析与处理等众多领域[1,2]  
.
Fig.1 A sample network with community structures  
1 一个具有社区结构的示例网络  
社区发现致力于有效地寻找到复杂网络中准确的社区结构.目前,主流的社区发现方法有层次聚类方法  
(Radicchi[7])、矩阵分块方法(MB-DSGE[8])、骨架图方法(gCluSkeleton[9])、标签传播方法(LPA[10],HANP[11])以  
及图嵌入方法(DeepWalk[12]),这些方法根据网络的拓扑结构,从不同的角度出发,解决复杂网络中的社区发现  
问题.  
k-均值等经典的聚类算法是解决社区发现问题的一类基本方法[13],然而在处理网络的高维相似度矩阵时,  
使用这些经典的聚类算法进行社区发现存在如下问题.  
(1) 使用邻接矩阵作为网络的相似度矩阵,不能全面地反映每个节点的局部信息.网络中除了直接相连的  
节点之间存在相似关系外,不直接相连的节点之间也存在不同程度的相似关系.例如:可以经过 s 跳到  
达彼此的节点对之间存在一定的相似关系,使用邻接矩阵作为网络的相似度矩阵只能简单地呈现直  
接相连的节点之间的相似关系,无法表示不直接相连的节点之间的相似关系.所以,邻接矩阵丢失了  
许多节点对的相似关系信息,不能全面地反映每个节点的局部信息.邻接矩阵包含信息有限的问题,  
影响社区发现的准确性;  
(2) 高维相似度矩阵不能反映网络拓扑结构的主要特征,对网络拓扑结构中的社区结构没有很好的表达  
能力,在使用 k-均值等经典的聚类方法对高维相似度矩阵进行社区发现时,存在结果社区不准确的  
问题.  
针对上述问题,文提出了基于深度稀疏自动编码器的社区发现算法 CoDDA(a community detection  
algorithm based on deep sparse autoencoder).CoDDA 算法能够根据网络拓扑结构,实现较为准确的社区发现.本  
文的主要贡献有如下 3 .  
(1) 提出基于 s-跳的预处理方法,对稀疏的邻接矩阵进行优化处理.预处理得到的相似度矩阵不仅可以表  
示直接相连的节点对之间的相似关系,也可以为不直接相连的节点对添加一定的相似关系;  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载