推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

面向大规模噪声数据的软性核凸包支持向量机

更新时间:2019-12-24 02:34:57 大小:3M 上传用户:守着阳光1985查看TA发布的资源 标签:噪声 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

现有的面向大规模数据分类的支持向量机(support vector machine,SVM)对噪声样本敏感,针对这一问题,通过定义软性核凸包和引入pinball损失函数,提出了一种新的软性核凸包支持向量机(soft kernel convex hull support vector machine for large scale noisy datasets,SCH-SVM).SCH-SVM首先定义了软性核凸包的概念,然后选择出能代表样本在核空间几何轮廓的软性核凸包向量,再将其对应的原始空间样本作为训练样本并基于pinball损失函数来寻找两类软性核凸包之间的最大分位数距离.相关理论和实验结果亦证明了所提分类器在训练时间,抗噪能力和支持向量数上的有效性.


部分文件列表

文件名 大小
面向大规模噪声数据的软性核凸包支持向量机.pdf 3M

部分页面预览

(完整内容请下载后查看)
2
Vol. 46 No. 2  
Feb. 2018  
2018  
2
ACTA ELECTRONICA SINICA  
大规模噪声数据的软机  
12  
2
1
1
, , ,  
顾晓清 倪彤姜志彬 士同  
( 1.  
大学学院  
214122; 2.  
大学信息科学与工程学院 州  
213164)  
:
( support vector machineSVM)  
噪声敏感 对这问  
有的大规模数据分类的机  
pinball  
题 通过定包和入  
( soft kernel convex hull sup-  
损失提出了新的软机  
概念 后选代  
pinball  
port vector machine for large scale noisy datasetsSCH-SVM) . SCH-SVM  
本在几何的软其对应间样训练基于  
损失数来  
,  
类软之间大分距离 论和实结果明了所提分类训练向  
的有效性  
:
;
;
; pinball ;  
损失分类  
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
大规模数据 噪声 包  
:
TP391. 4  
:
A
: 0372-2112 ( 2018) 02-0347-11  
DOI: 10. 3969 /j. issn. 0372-2112. 2018. 02. 013  
文献标识码  
文章编号  
电子学报  
Soft Kernel Convex Hull Support Vector Machine for  
Large Scale Noisy Datasets  
12  
2
1
1
GU Xiao-qing NI Tong-guang JIANG Zhi-bin WANG Shi-tong  
( 1. School of Digital MediaJiangnan UniversityWuxiJiangsu 214122China;  
2. School of Information Science and EngineeringChangzhou UniversityChangzhouJiangsu 213164China)  
Abstract: Current support vector machines ( SVMs) for large-scale datasets classification problems are almost sensi-  
tive to noises. To overcome this problema new soft kernel convex hull support vector machine called SCH-SVM is proposed  
based on the soft kernel convex hull and pinball loss function. SCH-SVM extracts the soft convex hull vectors in the kernel  
spacewhich can represent geometric profile of data in the kernel space. Then SCH-SVM represents the original samples  
which projected as the soft convex hull vectors for the training samplesand finds the maximum quantile distance between  
soft kernel convex hulls belonging to two classes by using pinball loss function. Theoretical analysis and numerical experi-  
ments show that SCH-SVM has distinctive ability of training timenoise resistibilityand the number of support vectors.  
Key words: large scale datasets; noise; soft kernel convex hull; pinball loss function; classification  
SVM  
有的大规模数据的  
分类都  
1
引言  
,  
基于本无噪声而 现实数据普  
9]  
( Support Vector MachineSVM)  
机  
使统  
型  
SVM  
3
点  
为  
计学论和问题 其  
成为领域非常的分  
, ,  
类 一类是模量  
10]  
11]  
;
一类是使用  
最小度模机  
问题描述规划问题 数  
SVM  
分类复杂度为  
1213]  
pinball  
噪声敏感损失如  
;
一  
损失数  
N
数据集来训练  
类是基于数据信息的挖掘 多任向  
3
O( N ) .  
SVM  
, :  
的计算复杂度 逼  
降低  
14]  
机  
数据的分类 问题 本文提出了大  
( Soft Kernel  
分类计算高不适用于大规模  
1]  
规划问题计算 贪婪近  
2]  
3]  
;
分解或  
45]  
规模噪声机  
机  
估  
6]  
7]  
8]  
Convex Hull Support Vector Machine for Large Scale Noisy  
SVM  
样  
: 2016-10-24;  
: 2017-10-17;  
:
责任编辑 马兰英  
收稿日期  
修回日期  
:
基金项目 国家自然科学基金  
( No. 61572236No. 61572085) ;  
( No. BK20160187)  
省自然科学基金  
348  
2018  
DatasetsSCH-SVM) SCH-SVM  
其定下  
:
包  
1516]  
1
(
)
d
X = { x  
集  
出代表的软训练样  
pinball  
义  
凸包  
i
d
*
助  
损失训练样  
R i = 12N}  
X
最小  
包  
距离分类分类  
X x  
线性  
i
在保持几何本在  
, :  
合来即  
几何内部噪声 包中的  
x =  
i
x
μ
it t  
( 5)  
*
x
X
t
.  
噪声敏感 训练文中  
= 1  
0.  
μ ≥  
it  
其中  
μ
SCH-SVM  
*
X
it  
明了  
使训练样  
x
t
本对分类度的影响的  
1,  
下面包和义  
2
(
)
x
核  
义  
核凸包  
2
pinball  
损失数  
FX F con( X) ,  
间 样包为 则  
SVM  
统  
噪声是分类噪  
X x  
本 在包  
i
,  
敏感 统计学应用献  
1213]  
, :  
线合来即  
pinball  
SVM  
中 提出了大化类  
损失数引入到  
( x ) =  
i
( x )  
μ   
it  
( 6)  
t
距离的分类合  
U = { u ,  
1
( x ) con( X)  
t
u u } q  
m
:
以表为  
2
= 1  
μ
it  
0.  
μ ≥  
it  
其中  
q
( x ) con( X)  
t
min { U} = { t: t Rt is large than q ratio of u } ( 1)  
i
2  
为了保性 在定的基础入  
pinball  
使用  
损失数来求样大分数  
“ ”  
ε 软化 包  
距离敏  
3
(
)
X
义  
核凸包  
设原空  
的软性  
本在与  
效提高分类力  
pinball  
损失数  
Z = { ( x ) , x X} X  
像  
 ∈  
i
13]  
i
L ( u)  
τ
:
为  
*
Z X  
包表为  
u,  
if u  
0
L ( u) =  
τ
{
的分之间在关τ  
( 2)  
:
线性关满足  
uotherwise  
τ
2
L  
其中  
/( 1 + )  
pinball  
τ 数  
τ  
损失数  
maxmin ( x ) -  
i
( x )  
t
( 7)  
μ   
it  
ε  
τ
x
X
i
*
( x )  
t
Z
( 1)  
τ 式  
q
= q/( 1 - q) .  
0 1  
其中 μ 且  
it  
= 1.  
μ
it  
据集  
X = { x x ,  
2
*
1
( x )  
t
Z
x }  
N
Y = { y y y } .  
2
和其签  
和  
Z
因此元素   
( x )  
与软核  
i
1
N
= { i | y = 1}  
i
= { i | y = - 1} .  
分  
i
Ⅰ  
为  
{
Ⅱ  
:
线成  
:
( x ) =  
i
( x ) +  
δ
i
( 8)  
γ   
it  
t
q
T
q
T
*
( x )  
t
Z
}
max min y ( w x + b) + min y ( w x + b)  
i
i
i
i
i
i
 
Ⅱ  
w
= 1b  
2
其中  
δ
ε 且  
i
( 3)  
*
*
if ( x ) Z , ( x ) Z and ( x ) Z  
i
μ
it  
t
i
13]  
提出的  
pin - SVM  
:
问题可为  
=
γ
it  
{
是软量 这噪声  
N
0otherwise  
1
C
2
min  
w
+
ξ
i
N
i = 1  
2 : 1  
噪声几何非  
wb,  
ξ
2
( 4)  
T
;
2
s. t. y ( w ( x ) + b) 1 - i = 12N,  
ξ
i
i
i
训练参与分类构建中 因此  
SCH-  
1
T
y ( w ( x ) + b) 1 +  
≤  
i
i = 12N  
ξ
i
i
SVM  
使用不同别样的软训练  
pin-SVM  
τ
时使用  
基础模型 大化类  
( 4)  
规划问题 复杂度为  
3
SCH-SVM  
距离得的分类模型  
约  
O( N ) .  
pin-SVM  
分类问题  
因此  
:
问题描述为  
3
面向规模噪声数据的软核凸包向  
 
M
1
C
N
2
min  
w
+
l( wb, ( x ) )  
t
( 9)  
wb  
2
t = 1  
l ( wb, ( x ) )  
t
pinball l ( wb,  
损 失 数  
其中  
3. 1 SCH-SVM  
思想  
T
T
( x ) ) = max{ 1 - y ( w ( x ) + b) 1 - y ( w ( x )  
τ    
t
SVM  
问题等使地  
t
t
t
t
14]  
+ b) } ,( x )  
t
M  
量  
是软量  
外围点的分类面  
几何是一种能描述轮  
SCH-SVM  
数 引α α到  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载