推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

属性约简准则与约简信息损失的研究

更新时间:2019-12-24 08:38:36 大小:1M 上传用户:zhiyao6查看TA发布的资源 标签:约简信息损失 下载积分:1分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

属性约简是粗糙集的重要研究内容,信息熵是度量信息量的方法.在研究绝对约简和几种相对约简的基础上,归纳出属性约简的一般准则.定义了基于条件属性信息熵的属性约简和基于联合熵的属性约简,研究了几种属性约简与绝对约简之间的关系.定义了基于条件属性信息熵的约简信息损失,澄清了属性约简不损失信息的含糊观念,指出了属性约简只是在约简准则意义下不损失信息,在信息熵意义下可能损失信息.为进一步研究粗糙集、粒计算中属性约简与分类夯实了信息论基础.


部分文件列表

文件名 大小
属性约简准则与约简信息损失的研究.pdf 1M

部分页面预览

(完整内容请下载后查看)
2
Vol. 45 No. 2  
Feb. 2017  
2017  
2
ACTA ELECTRONICA SINICA  
约简约简损失的研究  
123  
1
3
1
, , ,  
薛欢欢 苗夺谦 卢克文  
邓大勇  
( 1.  
师范大学与信工程学院 江金  
321004; 2.  
师范大学知学院 江金华  
321004;  
3.  
大学电子与信工程学院  
201804)  
:
.  
约简的重研究内容 度量的方法 研究约简约简的  
,  
基础约简的一条件属约简约简 研究种  
,  
约简约简关系 条件属约简损失 约简损失观  
, , 、  
出了约简是在约简则意义下不损失息 在意义可能损失研究计算  
约简息论基础  
:
;
;
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
约简 损失  
:
TP18  
:
A
: 0372-2112 ( 2017) 02-0401-07  
DOI: 10. 3969 /j. issn. 0372-2112. 2017. 02. 019  
文献标识码  
文章编号  
电子学报  
Study on Criteria of Attribute Reduction and  
Information Loss of Attribute Reduction  
123  
1
3
1
DENG Da-yong  
XUE Huan-huan MIAO Duo-qian LU Ke-wen  
( 1. College of MathematicsPhysics and Information EngineeringZhejiang Normal UniversityJinhuaZhejiang 321004China;  
2. Xingzhi CollegeZhejiang Normal UniversityJinhuaZhejiang 321004China;  
3. School of Electronics and Information EngineeringTongji UniversityShanghai 201804China)  
Abstract: Attribute reduction is one of important topics in rough set theoryand information entropy is an index of  
measuring the amount of information. After investigating absolute attribute reduct and several kinds of relatively attribute re-  
ductsa general criterion of reducts is induced in rough set theory. With this criterion of reductsattribute reduct based on in-  
formation entropy and attribute reduct based on joint entropy are defined. The relationships among attribute reducts and abso-  
lute attribute reduct are investigated. Moreoverinformation loss based on information entropy for attribute reducts is de-  
finedwhich can measure information loss after attribute reduction has been conducted. The old concepts that attribute reduc-  
tion can not lose information are improvedand attribute reduction and classification can be further investigated from infor-  
mation loss and information entropy.  
Key words: rough sets; attribute reduction; information entropy; joint entropy; information loss  
4 ~ 7]  
10]  
出了上 似  
度  
息  
度  
来刻和描数据的不性 其大一部不  
1
引言  
11]  
1213]  
1415]  
条件熵  
、 、  
熵  
12]  
处理问题思维是  
计算  
处理性问题的方法 计算的主要方法糊  
, :  
来作条件属约简则 例如 条  
3]  
4 ~ 7]  
8]  
9]  
集  
.  
理  
,  
由此生出了约简  
4 ~ 7]  
11 ~ 23]  
、 、  
一种处理数据数  
的研究  
条件属约简称  
学工数据挖掘的重方法  
集最的应用在于性分约  
保持非常同这点  
条件属约简保持息无损  
: 2016-03-21;  
: 2016-05-06; :  
责任编辑 杰  
收稿日期  
日期  
:
基金项目 国家自然科学基金  
( No. 61572442No. 61203247No. 61273304No. 61573259No. 61472166) ;  
( No. LY15F020012) ;  
江省自然科学基金  
( No. Q13F020006)  
江省自然科学年基金  
402  
2017  
?
?
Y ( i = 12M)  
i
类 决统  
DS = ( UAd)  
约简满足条件  
?
的信可以约简这些  
为  
POS ( d) =  
A
、  
问题对计算 至数据挖掘 说  
A( Y ) .  
i
Y
U/{ d}  
i
都非常要  
1
DS = ( UAd) ,  
称决性  
定义  
统  
对于条件属在  
d
h( 0  
h 1) A,  
≤ ≤ 依赖条件属性集 其中  
度  
, ,  
误区约简题 本文  
POS ( d)  
A
h = ( DSA{ d} ) =  
γ
、 、 、  
结合计算 息论基  
U
约简 简  
·
符号  
势  
于互为  
DS = ( UAd) ,( x) = { ( dd( y) ) :  
  
统  
.  
约简满足于  
y
xx U} .  
∈ ∧ ∈  
A
x u  
对于都有   
( x) = 1,  
条件属约  
DS = ( UAd)  
称为不  
统  
, ,  
并分其性证明了件属属  
致  
2. 2  
于  
 
定一个决统  
件属信  
DS = ( UAd) , A { d}  
在论  
量指损  
U
X Y,  
中  
X = U/A = { X ,  
1
上导出的划分分为  
失 指出了约简  
| X |  
i
X X } Y = U/{ d} = { Y Y Y } p( X ) =  
2
2
N
1
M
i
下的信能存件属熵  
| U|  
意义下的信在  
| Y |  
j
| X Y |  
j
i
p( Y ) =  
j
p ( X Y )  
j
=
p ( Y | X ) =  
j
i
i
| U|  
| U|  
误区点  
| X Y |  
j
i
2
i = 12Nj = 12M. A { d}  
的信熵  
知识  
| X |  
i
4 ~ 6]  
11 ~ 1524]  
:
介绍集  
与信熵  
关  
为  
N
知识  
2. 1  
H( DSA) = -  
p( X ) lbp( X ) ,  
i
i
i = 1  
集  
M
IS = ( UA) U  
A U  
是论是论上  
统  
H( DS{ d} ) = -  
p( Y ) lbp( Y ) .  
j
j
j = 1  
条件属性集 对于条件属性  
a
A
a:  
都存函数  
{ d}  
A
对于 条件为  
:
U
V V a . U  
域  
α
每个称为个对  
α
N
M
行  
H( DS{ d} |A) = -  
p( X )  
i
p( Y |X ) lbp( Y |X ) .  
j
j
i
i
i =1  
j =1  
B
A
x U  
下的信息  
对于意  
{ d}  
A
:
对于 为  
I( DS{ d} | A) = H( DS{ d} ) H( DS{ d} | A) .  
{ d}  
:
函数  
Inf ( x) = { ( aa( x) ) : a B} .  
B
A
:
为  
B -  
( )  
分明关系 称为关系 为  
N
M
H( DSA{ d} ) = -  
p( X Y ) lbp( X Y ) .  
i
IND( B) = { ( xy) : Inf ( x) = Inf ( y) } .  
B
∑∑  
i
j
j
B
i = 1 j = 1  
IND( B)  
2
xy  
B
的任  
满足  
素  
3
简  
x]  
分  
x
的  
IND( B)  
类  
B
IS = ( UA) B A X U 、  
  似  
统  
边界为  
4
我们讨集理论中的约简与 种相  
:
约简  
珔 珔  
B( X) = B( ISX) = { x U: x]  
X
∩ ≠  
} ,  
:
B
约简义如下  
62526]  
B( X) = B( ISX) = { x U: xX} ,  
∈   
B
2
IS = ( UA) B  
A
称  
定义  
DS  
定信统  
iff B A :  
满足条件  
BN( X) = B( ISX) B( ISX) .  
约简  
边界的信为  
:
( 1)  
( 2)  
x
对于都有  
Ux=x;  
B
A
珔 珔  
B( X) = B( ISX) = { xU: x]  
X
∩ ≠  
} ,  
S
B,  
在  
x
U
x]  
使 ≠  
S
B
B
对于 的  
B( X) = B( ISX) = { xU: xX} ,  
B
x.  
A
B
BN( X) = B( ISX) B( ISX) .  
:
约简为  
4 ~ 7]  
DS = ( UAd) { d} A =  
∩  
策  
统  
3
DS = ( UAd) B  
A
定义  
DS  
统  
d U  
块  
U/{ d} = { Y Y Y } ,  
M
iff B  
A
满足列  
的基简  
1
2

全部评论(0)

暂无评论