推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于自编码网络特征降维的轻量级入侵检测模型

更新时间:2019-12-24 00:17:35 大小:1M 上传用户:zhiyao6查看TA发布的资源 标签:自编码网络特征 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

基于支持向量机(SVM)的入侵检测方法受时间和空间复杂度约束,在高维特征空间计算时面临“维数灾害”的问题.为此,本文提出一种基于自编码网络的支持向量机入侵检测模型(AN-SVM).首先,该模型采用多层无监督的限制玻尔兹曼机(RBM)将高维、非线性的原始数据映射至低维空间,建立高维空间和低维空间的双向映射自编码网络结构,进而运用基于反向传播网络的自编码网络权值微调算法重构低维空间数据的最优高维表示,从而获得原始数据的相应最优低维表示;最后,采用SVM分类算法对所学习到的最优低维表示进行入侵识别.实验结果表明,AN-SVM模型降低了入侵检测模型中分类的训练时间和测试时间,并且分类效果优于传统算法,是一种可行且高效的轻量级入侵检测模型.


部分文件列表

文件名 大小
基于自编码网络特征降维的轻量级入侵检测模型.pdf 1M

部分页面预览

(完整内容请下载后查看)
3
Vol. 45 No. 3  
Mar. 2017  
2017  
ACTA ELECTRONICA SINICA  
3
基于自编码网络特征降维的  
轻量级入侵检测模型  
12  
1
3
1
高 妮 高 岭 贺毅岳 王 海  
( 1.  
710069; 2.  
710100;  
西北大学信息科学与技术学院 陕西西安  
西安财经学院信息学院 陕西西安  
3.  
710127)  
西北大学经济管理学院 陕西西安  
:
( SVM)  
基于支持向量机  
的入侵检测方法受时间和空间复杂度约束 在高维特征空间计算时面临 维数灾害  
.
( ANSVM) .  
首先 该模型采用多层无监督的限制玻  
的问题 为此 本文提出一种基于自编码网络的支持向量机入侵检测模型  
( RBM)  
, ,  
尔兹曼机  
用基于反向传播网络的自编码网络权值微调算法重构低维空间数据的最优高维表示 从而获得原始数据的相应最优低维表  
SVM  
ANSVM  
将高维 非线性的原始数据映射至低维空间 建立高维空间和低维空间的双向映射自编码网络结构 进而运  
;
.
示 最后 采用  
分类算法对所学习到的最优低维表示进行入侵识别 实验结果表明  
模型降低了入侵检测模型  
.
中分类的训练时间和测试时间 并且分类效果优于传统算法 是一种可行且高效的轻量级入侵检测模型  
:
;
;
;
;
关键词  
中图分类号  
URL: http: / /www. ejournal. org. cn  
特征降维 自编码网络 限制玻尔兹曼机 支持向量机 入侵检测  
TP393ꢀ 08  
03722112 ( 2017) 03073010  
DOI: 10. 3969 /j. issn. 03722112. 2017. 03. 033  
:
:
A
:
文章编号  
文献标识码  
电子学报  
A Lightweight Intrusion Detection Model Based on  
Autoencoder Network with Feature Reduction  
12  
1
3
1
GAO Ni GAO Ling HE Yiyue WANG Hai  
( 1. School of Information Science and TechnologyNorthwest UniversityXianShaanxi 710127China;  
2. School of Information Xian University of Finance and EconomicsXianShaanxi 710100China;  
3. School of Economics and ManagementNorthwest UniversityXianShaanxi 710100China)  
Abstract: Owing to the constraints of time and space complexitysupport vector machine ( SVM) faced with the problem  
of curse of dimensionalitywhen computation happens in highdimensional feature space. Thereforean intrusion detection model  
of support vector machine based on autoencoder network ( ANSVM) is proposed. Firstthe multilayer unsupervised restricted bo-  
ltzmann machine ( RBM) in our model is employed in mapping the vector of raw dada from highdimensional nonlinear space to  
lowdimensional spaceand a mutual mapping autoencoder network of highdimensional space and lowdimensional space is con-  
structed. Then autoencoder network weights of finetuning algorithm based on back propagation network is employed to recon-  
struct the new optimal highdimensional representation of data in lowdimensional spaceand the corresponding optimal lowdi-  
mensional representation of raw data can be obtained. FurthermoreSVM classification algorithm is employed to detect intrusion  
from the optimal lowdimensional data. The experimental results demonstrate that ANSVM model can effectively reduce the train-  
ing time and testing time of classifier in the intrusion detection model and its classification performance outperforms those tradi-  
tional methods. SoANSVM model is a feasible and efficient lightweight intrusion detection model.  
Key words:  
feature reduction; autoencoder network; restricted boltzmann machine; support vector machine;  
intrusion detection  
.
如何识别各种网络攻击是一个不可回避的关键技术  
1
引言  
( Intrusion DetectionID)  
入侵检测  
作为一种主动防御技  
.
Internet  
在全世界范围内的迅速发展 计算机  
随着  
术 逐渐成为保障网络系统安全的关键技术 入侵检测  
.
网络安全问题已成为一个备受关注的重大问题 其中  
( intrusion detection systemsIDS)  
系统  
的目的就是识别  
: 20150612;  
: 20150824;  
:
收稿日期  
修回日期  
责任编辑 郭游  
:
( No. 61373176) ;  
( No. 16XJC630001) ;  
( No. 2015JQ7278)  
陕西省自然基金  
基金项目 国家自然科学基金  
教育部人文社会科学研究青年项目  
731  
3
:
妮 基于自编码网络特征降维的轻量级入侵检测模型  
技术难13从上述案例可以看出 深度学习在复杂大  
.
.
不同寻常的访问或对安全内部网络的攻击 基于机器  
IDS  
学习的用户行为建模是  
的一个重要研究课题 即通  
规模数据的处理方面有着出色的表现 因此它是解决  
.
过学习网络流量和主机审计记录等观测数据来区分系  
.
入侵检测速度低的一种极具前景的方法  
Hinton  
统的正常行为和异常行为  
IDS  
本文将  
提出的非线性降维的自编码网络  
( Autoencoder NetworkAN)  
的深度学习方法引入到入侵  
以往的研究者在  
研究中引入了各种机器学习方  
1]  
2]  
3等方法都在  
检测领域中 通过具有多个隐藏层的神经网络的逐层  
K  
SOM  
法 如神经网络  
最近邻算法  
.
入侵检测系统中取得了突破性的进展 而支持向量机  
特征变换 将样本在原空间的高维特征转换成低维特  
4]  
( Support Vector MachineSVM)  
Vapnik  
提出 可  
征并进一步重构样本高维特征 在该非监督学习过程  
最早由  
有效地避免经典学习方法中出现的过学习 易陷入局部  
中获得原始数据的低维表示 从而显著降低数据的维  
5]  
6]  
.
Chitrakar  
SVM  
.
极小点等问题 尚文利  
等人将  
方法  
数 本文的工作重点不是分类器的参数优化 而是为分  
.
IDS  
SVM  
.
应用到  
虽然  
应用于大规模的入侵检测系统中时 通常受时间和空  
中 并证明  
具有很好的分类性能  
类器服务的特征降维算法 本文提出一种高效的特征  
SVM  
IDS,  
在小样本下能够取得较好效果 但实际  
降维算法来构建轻量级  
.
入侵分类精度  
旨在缩短训练时间 提高  
间复杂度约束 其本质原因是由于输入特征空间具有  
2
深度学习模型  
.
高维 非线性的特征 分类器所需训练样本的数目是关  
2. 1  
自编码网络  
于样本特征空间维数的近似指数级增长函数 在高维  
Hinton  
自编码网络是有  
提出的一种用于学习高效  
SVM  
特征空间计算时  
入侵检测面临 维数灾害 的问  
面临实时处理海量数据检测速度低的问  
题 检测速度是衡量入侵检测系统实时性要求的一个  
编码的人工神经网络 通过学习获得数据集的压缩编  
.
IDS  
题 当前  
11]  
.
码 可以达到数据降维的目的  
自编码网络能使具体  
.
的特征向量逐渐转化为抽象的特征向量 自编码网络  
能很好地满足高维数据空间和低维数据空间双向映射  
.
IDS  
重要评估指标 因此 构建高效的轻量级  
.
已成为当  
前研究热点  
( encoder)  
的非线性学习 它采用自适应 多层编码  
网络  
将高维原始数据转换成低维抽象数据 并利用类似的  
( decoder)  
IDS  
特征维数过多是导致  
检测速度低的主要原因  
很多研究者通过对高维 非线性特征空间进行约简来  
解码  
维数据表11]  
自编码网络是一种非监督学习方法 其工作原理  
网络从低维抽象数据重构原始数据的高  
.
解决此问题 因此 对高维数据进行特征降维成为入侵  
检测流程中不可或缺的步骤  
( KPCA)  
78混合核主  
( GA) KPCA  
.
. Kuang  
成分分析  
方法与遗传算法  
单独的  
进行入侵识别  
( GA)  
1
.
如图 所示 整个结构由编码器和解码器两部分构成  
SVM  
.
对高维数据进行约简 进而利用  
9]  
编码器用于降维 解码器用于重构 其视为编码器的逆  
Ahmad  
PCA  
研究了混合  
与遗传算法  
对高维数据  
. Lakhina  
.
过程 编码器和解码器之间还存在一个交叉部分 称为  
SVM  
进行约简 进而利用  
进行入侵识别  
10等  
.  
代码层 原始高维数据输入到编码器中 被压缩后表  
PCA  
ANN  
.
相结合做异常识别 上述研究在  
人研究了  
( code layer) code layer  
述为代码层  
.
低维表示  
是输入数据的一个  
入侵检测系统中对输入特征空间进行降维 有效提高  
.
了分类的整体性能 然而 当高维特征数据呈现非线性  
结构时 上述方法的主要缺陷在于它们只能学习到已  
知数据集的低维结构 不能给出高维空间到低维空间  
的确定性映射 且这些方法在特征子集的检测速度上  
.
有待提高 因此 在保证高分类精度的前提下 尽量学习  
到最优的低维特征空间用于提高检测速度 是本文提  
.
通过调整编码器和解码器的参数 使得重输出的  
出特征降维算法的目的  
重构数据和一开始的原始数据误差最小 意味着由抽  
2006 Hinton Science》  
上发表一篇关于 自编  
11]  
象的特征向量构成的代码层数据是原输入数据的有效  
码网络 深度学习方法的论文  
. 2009  
该方法已成为大数据  
.
低维表示 该过程中输入原始数据是无标签数据 相应  
和人工智能的一个热潮  
年以来微软研究人员通  
地误差是通过对重构数据与原输入数据的比较计算  
.
Hinton  
( Restricted  
( Deep Belief  
过与  
合作 首次将限制玻尔兹曼机  
得到  
Boltzmann MachineRBM)  
NetworksDBN) 12]  
和深度信念网络  
2. 2 RBM  
神经网络  
引入到语音识别声学模型训练中 使  
2. 2. 1  
模型结构  
30% . 2013  
得语音识别的错误率相对减低  
DNN  
年百度采用  
在线计算的  
RBM  
是自编码网络的核心组件之一 是一个两层  
9
模型 更好地解决了  
DNN  
多达 层的  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载