推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

双类型异质网中基于排序和聚类的离群点检测方法

更新时间:2019-12-24 01:59:28 大小:995K 上传用户:守着阳光1985查看TA发布的资源 标签:双类型异质网 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

挖掘隐藏在网络中不同于正常数据对象的离群点是数据挖掘的重要任务之一.目前,针对双类型异质信息网络离群点检测的研究工作相对较少,原本适用于同质网络的离群点检测方法将很难适用于双类型异质网络.为此,提出了异质信息网络中基于排序和聚类的离群点检测方法(RKBOutlier).从异质信息网络中抽取两种类型的对象以及链接两种对象的语义信息,将待检测的数据作为属性对象,将另一类型数据作为目标对象,对目标对象进行聚类来检测属性对象在各个聚类中的分布情况,数据分布异常的对象即为离群点.将排序和聚类相结合来显著提高聚类的准确度.实验结果表明,RKBOutlier可以在双类型异质信息网络中有效地检测出离群点.


部分文件列表

文件名 大小
双类型异质网中基于排序和聚类的离群点检测方法.pdf 995K

部分页面预览

(完整内容请下载后查看)
2
Vol. 46 No. 2  
Feb. 2018  
2018  
2
ACTA ELECTRONICA SINICA  
类型异质基于类的  
 
12  
1
1
1
1
, , , ,  
彭 涛 杨妮亚 徐原博 王冰冰 刘 露  
( 1.  
大学计算机科学与技术学院  
130012;  
2.  
( ) ,  
计算与知识工程重点大学 春  
130012)  
:
,  
挖掘网络中不同常数据点是数据挖掘的重一 目类型异质  
.  
信息网络的研究工本适用同质网络的法将很难适用类型异质网络 为  
提出了异质信息网络基于类的法  
( RKBOutlier) .  
从异质信息网络抽取类型的象  
, , ,  
信息 数据作性对一类型数据作类  
.  
性对的分情况 数据象即合来显提高类的  
结果表明  
RKBOutlier  
以在类型异质信息网络效地点  
:
;
;
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
测 排类 目性对象  
:
TP391  
:
A
:
文章编号  
0372-2112 ( 2018) 02-0281-08  
文献标识码  
DOI: 10. 3969 /j. issn. 0372-2112. 2018. 02. 004  
电子学报  
An Outlier Detection Method Based on Ranking and Clustering in  
Bi-typed Heterogeneous Network  
12  
1
1
1
1
PENG Tao YANG Ni-ya XU Yuan-bo WANG Bing-bing LIU Lu  
( 1. College of Computer Science and TechnologyJilin UniversityChangchunJilin 130012China;  
2. Key Laboratory of Symbolic Computation and Knowledge Engineering( Jilin University) Ministry of EducationChangchunJilin 130012China)  
Abstract: Mining the outliers that are different from normal data objects in the network is one of the important tasks  
in data mining. At presentthe research aiming at outlier detection in bi-typed heterogeneous information network is relatively  
small. The methods which are applicable to homogeneous network can not be applied to bi-typed heterogeneous networks.  
Thereforewe propose a Rank-Kmeans Based Outlier detection methodcalled RKBOutlierin heterogeneous information net-  
work. The two kinds of the objects and the connected semantic information are extracted from the heterogeneous information  
network. One type of the objects is regarded as the attribute objectsanother type of the objects is regarded as the target ob-  
jects. We perform cluster partitioning on target objects to detect the distribution of the attribute objects in each cluster. The  
objects which are abnormal at data distribution are considered to be the outliers. Ranking and clustering are combined to sig-  
nificantly improve the accuracy of clustering. The experimental results show that RKBOutlier can effectively detect outliers  
in bi-typed heterogeneous information network.  
Key words: outlier detection; ranking; clustering; target object; attribute object  
1]  
数据 的规律不同数据  
群  
1
引言  
, ,  
不同噪声 数据的信息 以  
异质信息网络挖掘数据挖掘的一类重问题  
数据分析 广泛的  
分析网络稀少的模式具现  
2]  
3]  
4]  
应用 网络侵  
.  
融诈骗 等等  
医疗诊断  
义 离数据集合分  
在异质信息网络中 不同类型的系  
: 2016-09-26;  
: 2016-11-14;  
:
责任编辑 蓝红杰  
收稿日期  
修回日期  
:
基金项目 国家自然科学基金  
( No. 60903098) ;  
( No. 2016183No. 2016184)  
大学研究创新基金  
282  
2018  
丰富信息 使得离更  
. Aktolga  
6]  
在文技术  
数据  
. Zimek  
用在信息人 研究抽样技术离  
7]  
/ 、 、  
复杂 信息网络作者 论文  
类型的它们之间的多传  
8]  
测器之间性 文出了新的改  
使数据动作技术在个体测器以  
统的异质信息网络分析网络中  
个对象之间进而数据对  
及等级积累人的排名群  
.  
使得离分复杂并且受  
9]  
性 文献 给出了使敏  
以上想法本文提出类型异质信息网  
( )  
哈希 激光技术基于距离近  
10]  
. 3 .  
问题 第  
1
概念与  
Knorr  
所提出雨季距离提  
问题异质信息网络的象之  
11]  
. 2  
信息 第 问题类型网络的  
BDOD. ,  
人  
新的法  
RSOD , ,  
利用论中的知  
. 3  
数据问题出异质网络分  
提出了  
异质息网络据集  
概念构建三类型的分析序  
DBLP  
, ,  
例 数据集些作者 他们表论文  
元素情况来点  
,  
领域专一 生这种情况 极可论  
于网络不同类型的关  
,  
文中 作者情况 在本文中 我们将作  
异质信息网络问题逐渐引研  
12]  
,  
数据象 针对上述问题 在异  
. Ayushi  
者们对异质信息网络群  
13]  
2
信息网络中提类型的数据它们之间  
. Manish  
问题 提出长方体异图  
人  
提出框架 紧密耦进  
outlier-aware  
,  
类型异质信息网络属  
2 .  
性对类型的性对标  
化的构建  
社区匹配异  
特征 性对与目象之间权值作  
,  
数据 多研究者们以在类的基  
14]  
.  
为特征异质网络离  
的研究 如  
Basu  
K-  
提出了  
点的信息提高了效  
means  
的基于方  
,  
类有一程度的用 本文  
, , .  
个对距离在  
Rank Kmeans,  
簇  
15Van  
中  
提出基于法  
人分析覆盖数据  
. Sun  
化划分在提高的  
提出了基于图聚法  
16]  
,  
提高了效点的中 我义  
NetClus .  
法 将异质网络基于序  
提出了  
应用型网络中  
在异质子网中节点的测  
17]  
类型异质信息网络概念 性  
. Zhuang  
提出了  
领域的分情况 性  
, ,  
性对象 即为  
BMSim,  
子网网络查  
. Gupta  
进而分析网络等  
点  
18]  
: ( 1)  
CDOutliers ,  
矩  
本文贡献下  
提出了类型  
提出了  
分解测  
网络个和网络结构致  
19]  
RKBOutlier,  
过提异质网络中  
2
. Qi  
类的会  
法  
类型的数据象并分析性对数据情况来检  
( 2)  
模型 并且网络示  
点  
类型网络提高率  
( 3)  
提出应用到  
势  
将属性对特征表象  
研究者们在同质网络多类型异质网络很  
分析性对数据群  
多的方面的研究 类型异质网络  
( 4)  
,  
的研究情况与多类  
类型异质信息网络子的概  
( 5)  
性对程度  
型网络较来类型网络模型计算的  
过在不同数据  
, ,  
中进结果表明 我提出类型异质信息  
,  
对上情况 本文类型异质  
RKBOutlier  
法  
网络效地进测  
信息网络提出了  
2
3
相关工作  
问题  
数据挖掘个关问题 在同  
, ,  
在本节中 先给后给类  
信息网络研究者们的研究  
. Guniset-  
异质信息网络形式义  
5]  
20]  
ti  
1(  
质信息网络  
)
G =  
向图  
使统计居找出异  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载