推荐星级：

复杂网络大数据中重叠社区检测算法

更新时间：2019-12-25 08:07:10 大小：1M 上传用户：zhiyao6 查看TA发布的资源 标签：复杂网络大数据 下载积分：1分评价赚积分（如何评价?）打赏收藏评论(0) 举报

资料介绍

提出一种新的面向复杂网络大数据的重叠社区检测算法DOC(detecting overlapping communities over complex network big data),时间复杂度为O(nlog2(n)),算法基于模块度聚类和图计算思想,应用新的节点和边的更新方法,利用平衡二叉树对模块度增量建立索引,基于模块度最优的思想设计一种新的重叠社区检测算法.相对于传统的重叠节点检测算法,对每个节点分析的频率大为降低,可以在较低的算法运行时间下获得较高的识别准确率.复杂网络大数据集上的算法测试结果表明:DOC算法能够有效地检测出网络重叠社区,社区识别准确率较高,在大规模LFR基准数据集上其重叠社区检测标准化互信息指标NMI最高能达到0.97,重叠节点检测指标F-score的平均值在0.91以上,且复杂网络大数据下的运行时间明显优于传统算法.

部分文件列表

文件名	大小
复杂网络大数据中重叠社区检测算法.pdf	1M

立即下载

【关注B站账户领20积分】

部分页面预览

（完整内容请下载后查看）

软件学报 ISSN 1000-9825, CODEN RUXUEW

Journal of Software,2017,28(3):631-647 [doi: 10.13328/j.cnki.jos.005155]

E-mail:

Tel: +86-10-62562563

复杂网络大数据中重叠社区检测算法^∗

乔少杰

韩

楠

张凯峰

邹

磊

王宏志

Louis Alberto GUTIERREZ⁶

¹(成都信息工程大学信息安全工程学院,四川成都 610225)

²(成都信息工程大学管理学院,四川成都 610103)

³(西南交通大学信息科学与技术学院,四川成都 611756)

⁴(北京大学计算机科学技术研究所,北京 100871)

⁵(哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨 150006)

⁶(Department of Computer Science, Rensselaer Polytechnic Institute, New York, USA)

通讯作者: 韩楠, E-mail:

摘

要: 提出一种新的面向复杂网络大数据的重叠社区检测算法 DOC(detecting overlapping communities over

complex network big data),时间复杂度为 O(nlog²(n)),算法基于模块度聚类和图计算思想,应用新的节点和边的更新

方法,利用平衡二叉树对模块度增量建立索引,基于模块度最优的思想设计一种新的重叠社区检测算法.相对于传统

的重叠节点检测算法,对每个节点分析的频率大为降低,可以在较低的算法运行时间下获得较高的识别准确率.复杂

网络大数据集上的算法测试结果表明:DOC 算法能够有效地检测出网络重叠社区,社区识别准确率较高,在大规模

LFR 基准数据集上其重叠社区检测标准化互信息指标 NMI 最高能达到 0.97,重叠节点检测指标 F-score 的平均值在

0.91 以上,且复杂网络大数据下的运行时间明显优于传统算法.

关键词: 复杂网络;大数据;重叠社区检测;模块度;图计算

中图法分类号: TP311

中文引用格式: 乔少杰,韩楠,张凯峰,邹磊,王宏志,GUTIERREZ LA.复杂网络大数据中重叠社区检测算法.软件学报,2017,

28(3):631-

英文引用格式: Qiao SJ, Han N, Zhang KF, Zou L, Wang HZ, Gutierrez LA. Algorithm for detecting overlapping communities

from complex network big data. Ruan Jian Xue Bao/Journal of Software, 2017,28(3):631-

cn/1000-9825/5155.htm

Algorithm for Detecting Overlapping Communities from Complex Network Big Data

QIAO Shao-Jie¹, HAN Nan², ZHANG Kai-Feng³, ZOU Lei⁴, WANG Hong-Zhi⁵, Louis Alberto GUTIERREZ⁶

¹(College of Information Security Engineering, Chengdu University of Information Technology, Chengdu 610225, China)

²(School of Management, Chengdu University of Information Technology, Chengdu 610103, China)

³(School of Information Science and Technology, Southwest Jiaotong University, Chengdu 611756, China)

⁴(Institute of Computer Science and Technology, Peking University, Beijing 100871, China)

⁵(Department of Computer Science and Technology, Harbin Institute of Technology, Harbin 150006, China)

⁶(Department of Computer Science, Rensselaer Polytechnic Institute, New York, USA)

∗ 基金项目: 国家自然科学基金(61100045, 61363037); 教育部人文社会科学研究规划基金(15YJAZH058); 教育部人文社会科

学研究青年基金(14YJCZH046); 成都市软科学项目(2015-RK00-00059-ZF); 四川省教育厅资助科研项目(14ZB0458)

Foundation item: National Natural Science Foundation of China (61100045, 61363037); Planning Foundation for Humanities and

Social Sciences of Ministry of Education of China (15YJAZH058); Youth Foundation for Humanities and Social Sciences of Ministry of

Education of China (14YJCZH046); Soft Science Foundation of Chengdu (2015-RK00-00059-ZF); Foundation of Educational

Commission of Sichuan Province (14ZB0458)

收稿时间: 2016-07-15; 修改时间: 2016-09-14; 采用时间: 2016-11-01; jos 在线出版时间: 2016-11-29

CNKI 网络优先出版: 2016-11-29 13:34:57, http://www.cnki.net/kcms/detail/11.2560.TP.20161129.1334.002.html

632

Journal of Software 软件学报 Vol.28, No.3, March 2017

Abstract: Currently, the number of Internet users, along with complex networks including online social networks and electronic

commerce networks, is growing explosively. To effectively and efficiently detecting overlapping community structure from complex

network, big data plays an essential role in point of interest recommendation and hotspot propagation. In this study, a new algorithm over

complex networks is proposed to detecting overlapping communities with a time complexity of O(nlog²(n)). The algorithm applies a new

method for updating node and edge modularity based on the techniques of modularity clustering and graph computing. Balanced binary

tree is used to index the modularity increment, and an overlapping community detection approach is provided based on the idea of

modularity optimization to reduce the frequency of node analysis compared to traditional approaches. Experiments are conducted on real

complex network big data, and the results show that the DOC algorithm can effectively detect overlapping communities with high

accuracy, the normalized mutual information (NMI) can reach to 0.97 in large-scale LFR benchmark datasets, and the overlapping

community detecting standard F-score value is averagely higher than 0.91. In addition, the runtime efficiency beats traditional approaches

in complex network big data.

Key words: complex network; big data; overlapping community detection; modularity; graph computing

随着互联网、物联网技术的快速发展,事物之间的联系更加紧密,错综复杂的联系形成了多样、多变、规

模庞大的网络,例如人际交往形成的复杂社交网络、蛋白质交互网络、基于地理空间的交通网络、城市路线网

络等.上述网络因其结构复杂、网络进化、连接和节点的多样性、多重复杂性融合,被称为复杂网络^[1].复杂网

络在规模与复杂度上的快速增长,演变成网络大数据^[2].在现实网络中,社区重叠是复杂网络大数据中另一重要

特征,即,不同社区之间具有重叠的节点.重叠社区的检测对于网络结构分析、社区划分等具有重要研究价值和

科学意义.值得注意的是,国家重点基础研究发展计划(973)和重大科学研究计划将社交网络结构分析的基础研

究作为重要支持方向.

复杂网络大数据中,社区发现算法的研究涉及社会学、生物学、计算机等交叉学科,具有广阔的应用前景.

例如在生物学方面,社区检测可以从蛋白质、新陈代谢网络中提取信息,帮助了解生命的奥秘.本文的主要研究

动机包括:

1) 早期社区发现研究工作很少考虑重叠节点,建立在节点只属于某一社区的假设之上.然而,在网络大

数据中,社区之间重叠是其重要结构特征,考虑网络节点的重叠性可以极大地提高算法的准确性;

2) 传统的非重叠社区发现算法已经不能满足对现实网络分析的要求.现有的重叠社区检测算法时间复

杂性较高,应用于大规模复杂网络数据时,其劣势相当明显.当网络节点规模上万,节点连接关系更加

复杂的情况下,甚至无法对社区进行划分;

3) 现有重叠社区检测算法很难兼顾算法的准确性和实效性.

针对上述不足,本文的主要贡献包括:基于模块度思想和图论知识,应用新的网络模块度更新方法和社区合

并方法,采用平衡二叉树对其进行优化,其节点间模块度增量更新算法时间复杂度仅为 O(log²(n)),整体算法时

间复杂度为 O(nlog²(n)),其中,n 表示节点的个数;在非重叠网络社区检测算法得到的社区划分基础上,提出了一

种新的重叠社区检测算法,降低了每个节点识别的时间代价,算法的复杂度仅为 O(n);为该类问题提供一种新的

思路,即,将重叠节点的检测作为了一个分类问题进行研究;将所提算法与经典的社区识别算法 COPRA 算法

(clustering overlap propagation algorithm)^[3]、SLPA 算法(speaker-listener label propagation algorithm)^[4]和 CONGA

算法(cluster-overlap newman girvan algorithm)^[5]进行了对比实验,从多角度验证所提方法的性能优势.

全部评论(0)

暂无评论

评论赚积分>>

上传资源上传优质资源有赏金

最新上传

打赏
30日榜单

21ic小能手打赏10.00元 3天前

资料：开源无线麦克风（Open-Source Wireless Microphone）项目
799902619 打赏1.00元 3天前

资料：新立新龙软件
21ic小能手打赏10.00元 3天前

资料：FLPowerPro 专业开源电源供应器项目
21ic小能手打赏10.00元 3天前

资料：ESP 智能电动牙刷（ESP Toothbrush）项目资料包
21ic小能手打赏10.00元 3天前

资料：65535 阶高精度数字电位器项目
21ic小能手打赏10.00元 3天前

资料：ESP32 迷你墨水屏 MP3 播放器项目
21ic小能手打赏10.00元 3天前

资料：ESP Box 3 摇杆版（ESP Box 3 Joystick Edition）项目
21ic小能手打赏10.00元 3天前

资料：改进型 Exlink 多功能调试器（分离叠板）项目
21ic小能手打赏10.00元 3天前

资料：迷你音频稳压器（Mini Audio Regulator）项目
21ic小能手打赏10.00元 3天前

资料：Tuya T5 智能像素灯（Tuya T5 Pixels）项目
21ic小能手打赏10.00元 3天前

资料：基于 STM32 的多传感器物联网采集板项目总结
21ic小能手打赏10.00元 3天前

资料：ESP32 最小系统板（ESP32 Minimal System Board）项目
21ic小能手打赏10.00元 3天前

资料：5.8GHz FPV 图传模块项目
21ic小能手打赏10.00元 3天前

资料：智谱开源AutoGLM
21ic下载打赏310.00元 3天前

用户：jh0355
21ic下载打赏310.00元 3天前

用户：zhengdai
21ic下载打赏310.00元 3天前

用户：gsy幸运
21ic下载打赏230.00元 3天前

用户：小猫做电路
21ic下载打赏210.00元 3天前

用户：w178191520
21ic下载打赏60.00元 3天前

用户：jh03551
21ic下载打赏90.00元 3天前

用户：铁蛋锅

21ic下载打赏80.00元 3天前

用户：xzxbybd
21ic下载打赏60.00元 3天前

用户：kk1957135547
21ic下载打赏60.00元 3天前

用户：w1966891335
21ic下载打赏60.00元 3天前

用户：w993263495
21ic下载打赏60.00元 3天前

用户：sun2152
21ic下载打赏60.00元 3天前

用户：xuzhen1
21ic下载打赏60.00元 3天前

用户：liao6
21ic下载打赏70.00元 3天前

用户：liqiang9090
21ic下载打赏70.00元 3天前

用户：mulanhk
21ic下载打赏20.00元 3天前

用户：x15580286248
21ic下载打赏30.00元 3天前

用户：玉落彼岸
21ic下载打赏5.00元 3天前

用户：hnygpx
21ic下载打赏10.00元 3天前

用户：vikey_zhu
21ic下载打赏5.00元 3天前

用户：fine0406
21ic小能手打赏15.00元 3天前

资料：Timer Z 智能定时器（Timer Z Intelligent Timer）项目
21ic小能手打赏15.00元 3天前

资料：微型便携式无线心电图仪（Miniature Portable Wireless ECG）项目
21ic小能手打赏10.00元 3天前

资料：多功能函数信号发生器（Multi-Function Frequency Generator）项目
21ic小能手打赏10.00元 3天前

资料：电子DIY愚人节趣味互动项目（April Fools Day Project）项目
21ic小能手打赏10.00元 3天前

资料：基于 ESP32 的多传感器环境监测节点项目

复杂网络大数据中重叠社区检测算法

资料介绍

部分文件列表

部分页面预览

相关下载

全部评论(0)

热门标签

最新上传

热门下载

资料专题

推荐下载

专栏首页