推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

融合标签平均划分距离和结构关系的微博用户可重叠社区发现

更新时间:2019-12-24 13:48:59 大小:1M 上传用户:守着阳光1985查看TA发布的资源 标签:可重叠划分 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

提出了一种融合标签平均划分距离和结构关系的微博用户可重叠社区发现算法.首先从信息论与距离的概念出发,定义基于核心标签平均划分距离的准划分算法;再根据用户关注关系定义结构属性向量,并计算用户结构相异度,进而对核心标签平均划分距离和用户结构相异度进行权重调节,得到综合划分相异度;最后将综合划分相异度最低的标签所划分出的分组作为本次循环的新社区;实验表明,该方法能够识别可重叠社区且具有实际应用意义.


部分文件列表

文件名 大小
融合标签平均划分距离和结构关系的微博用户可重叠社区发现.pdf 1M

部分页面预览

(完整内容请下载后查看)
11  
Vol. 46 No. 11  
Nov. 2018  
2018  
11  
ACTA ELECTRONICA SINICA  
距离关系的  
可重发现  
12  
1
3
1
1
, , , ,  
慧芳 陈海波 邴 睿 乐乐  
( 1.  
西大学计算机科学与工学院 甘肃州  
730070; 2.  
, ,  
电子科大学 广西可信实验广西林  
541004;  
3.  
湘潭大学信息工学院 湘潭  
411105)  
:
提出了一种距离关系可重发现首先信息距离  
, ; ,  
距离准划法 再关系构属计算用构  
, , ;  
相异距离相异分相异最后分相异度  
; ,  
分组作区 实验表明 够识可重区且应用义  
:
;
;
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
可重距离 相异分相异度  
TP393. 09 0372-2112 ( 2018) 11-2612-07  
DOI: 10. 3969 /j. issn. 0372-2112. 2018. 11. 007  
:
:
A
:
文章编号  
文献标识码  
电子学报  
Leveraging Tag Mean Partition Distance and Social  
Structure for Overlapping Microblog User Community Detection  
12  
1
3
1
1
MA Hui-fang CHEN Hai-bo ZHAO Wei-zhong BING Rui HUANG Le-le  
( 1. Computer Science and EngineeringNorthwest Normal UniversityLanzhouGansu 730070China;  
2. Guangxi Key Laboratory of Trusted SoftwareGuilin University of Electronic TechnologyGuilinGuangxi 541004China  
3. College of Information EngineeringXiangtan UniversityXiangtanHunan 411105China)  
Abstract: In this papera microblog user community detection algorithm via tag mean partition distance and social  
structure is proposed. Firstlythrough the concept of information theory and distancea community pre-partition algorithm  
based on the mean partition distance of core tags is established. Furthermorea structure attribute vector is defined accord-  
ing to the users following and follower relationshipsbased on which the user structure dissimilarity is calculated. Thenthe  
comprehensive division dissimilarity is derived by adjusting the weight of mean distance of core tag and user structure dis-  
similarity. Finallythe subgroup corresponding to the tag with the lowest comprehensive division dissimilarity degree is  
considered as a new community for one iteration. Experiments show that the proposed method is effective and has practical  
significance.  
Key words: overlapping community detection; core tag; mean partition distances( MPD) structure dissimilarity; com-  
prehensive division dissimilarity( CDS)  
是否以包中 可发现为  
1
引言  
可重发现和不可重发现 于不可重叠  
一种复杂网络一种区  
发现 模块思想目  
构 该特点网络点连密  
网络挖掘流 经括  
Fast-Newman  
, ,  
之间的  
1]  
另外是未考虑  
有着重义  
2]  
RAK  
社  
检测法  
内外发现研究点  
3]  
发现模块化数方关  
: 2017-10-24;  
: 2018-01-07;  
:
责任编辑 蓝红杰  
收稿日期  
修回日期  
:
基金项目 国家自然科学基金  
( No. 61762078No. 61762080) ;  
( No. kx201705)  
广西可信实验研究题  
2613  
11  
:
距离关系可重发现  
签概并未考虑到  
作后续分  
,  
情况 着网络的日复杂社  
2. 2  
距离  
7]  
关系 可重发现  
Mantaras  
距离后分组  
( Partition) .  
于条出了一种于  
是近研究热点 性的有基标  
4]  
的可重法  
通过义划函  
本文以  
分  
地控制据  
为属义  
:
产生的信息矩阵监督社  
1(  
熵  
)
t
T
t  
构  
i
给定签  
i
core  
5]  
训练 重  
V/t = { C C } P( C )  
i
t
到包签  
i
为  
i
i
i
发现半  
t  
的用合的熵  
i
H( t )  
i
监督先决件  
( Partition Entropy)  
:
为  
本文信息出一种融  
合用可重法  
( Mean Partition Distance and Social StructureMPDSS) .  
i
H( t ) = - P( C ) log P( C ) P( C ) log P( C )  
2 i  
( 5)  
i
i
2
i
2 (  
)
t t T  
j core  
义  
条件熵  
给定签  
i
V/t = { C C }  
i
t t  
i
V/t = { C ,  
j
分分别为  
j
i
i
j
首先通过度  
j
C } t CH  
t
熵  
i
j
ti  
, ,  
集 将据 将包  
( t ) ( Partition Conditional Entropy)  
j
:
为  
的用计算用该核  
CH ( t ) = - P( C ) P( C | C ) log P( C | C )  
2
ti  
j
j
i
j
i
j
距离 再该  
i
P( C ) P( C | C ) log P( C | C )  
2 i  
( 6)  
j
j
j
相异分相异度  
3 (  
)
t t T  
j core  
义  
联合熵  
给定签  
i
分组作当前环产生策略反  
H( t t ) ( Partition Joint Entropy)  
j
:
熵  
为  
( 7)  
V/t  
i
满足要求  
H( t t ) = H( t ) + CH ( t )  
tj  
i
j
j
i
2
核心分  
4 (  
)
V/t  
分  
义  
距离  
分  
i
j
d( V/t V/t ) ( Tag Partition Distance)  
j
距离  
义  
i
本文网络图 图户  
:
;  
标  
d( V/t V/t ) = CH ( t ) + CH ( t )  
j
( 8)  
的用分组 分  
i
j
ti  
tj  
i
5 (  
)
V/t  
分  
i
义  
距离  
距离策略正  
V/t  
d ( V/t V/t ) ( Normaliza-  
i
距离  
G = ( VET) ,  
合  
V
网络为三元组  
j
n
j
tion Tag Partition Distance)  
V/t  
V/t  
距  
j
= { v v v } v  
1
V
. E = { v v > | v  
点  
i
i
2
n
i
j
i
为  
:
v v v V} . T = { t t t }  
m  
注  
合  
的用的  
T = T = { t t t } . T  
core  
j
i
j
1
2
m
d( V/t V/t )  
j
T = { t t t }  
数  
i
i
i1  
i2  
iri  
d ( V/t V/t ) =  
j
( 9)  
n
i
n
'
n
H( t t )  
j
∪  
T =  
i
i
i = 1  
i = 1  
i
1
2
m
会为以不情  
T  
T
| T | = l. t  
对用合  
i
合  
core  
core  
V/t = { C C } C  
中子用表  
, ,  
次 因成立 不过  
V
为  
i
i
i
i
i
使签  
t
的用合  
i
C C = V.  
i
2. 1  
2. 3  
扩充核心签  
信息 体  
均划距离  
6(  
签平均划距离  
)
t t  
给定签  
j
i
.  
过长时兴趣 含  
T
t MPD  
距离  
i
core  
6]  
的信息有的用户描述  
注  
( t ) ( Mean Partition Distance)  
i
:
为  
l
- ,  
数量矩阵稀疏 核  
d ( V/t V/t) ]  
j
n
i
指示充就应用义  
j = 1j  
i
MPD( t ) =  
i
( 10)  
l - 1  
用  
4,  
行扩造  
n × m  
-
的用矩  
MPD( t )  
i
M,  
素  
M( ki)  
v
t
重  
i
w .  
ki  
M
中  
k
i
为  
E ;  
i
M
i
中第 重  
程  
D t  
i
TD  
为  
i
TD = E /  
i
方差为  
D .  
度  
. t t  
表明 所得与用  
i
i
i
i
指示  
t  
程度选择 终  
i
i
强度 取  
TD  
top-l  
较大的 个为核标  
足  
i

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载