推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于深度卷积神经网络的网络流量分类方法

更新时间:2019-12-25 13:12:47 大小:584K 上传用户:守着阳光1985查看TA发布的资源 标签:深度卷积神经网络网络流量 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

针对传统基于机器学习的流量分类方法中特征选取环节的好坏会直接影响结果精度的问题,提出一种基于卷积神经网络的流量分类算法。首先,通过对数据进行归一化处理后映射成灰度图片作为卷积神经网络的输入数据,然后,基于LeNet-5深度卷积神经网络设计适于流量分类应用的卷积层特征面及全连接层的参数,构造能够实现流量的自主特征学习的最优分类模型,从而实现网络流量的分类。所提方法可以在避免复杂显式特征提取的同时达到提高分类精度的效果。通过公开数据集和实际数据集的系列仿真实验测试结果表明,与传统分类方法相比所提算法基于改进的CNN流量分类方法不仅提高了流量分类的精度,而且减少了分类所用的时间。


部分文件列表

文件名 大小
基于深度卷积神经网络的网络流量分类方法.pdf 584K

部分页面预览

(完整内容请下载后查看)
39 卷第 1 期  
2018 1 月  
Vol.39 No.1  
January 2018  
Journal on Communications  
基于深度卷积神经网络的网络流量分类方法  
王勇 1,2,3,周慧怡 2,3,俸皓 1,叶苗 3, 4,柯文龙 2  
1. 桂林电子科技大学计算机与信息安全学院,广西 桂林 5410042. 桂林电子科技大学信息与通信学院,广西 桂林 541004;  
3. 桂林电子科技大学认知无线电与信息处理省部共建教育部重点实验室,广西 桂林 541004;  
4.桂林理工大学信息科学与工程学院,广西 桂林 541004)  
要:针对传统基于机器学习的流量分类方法中特征选取环节的好坏会直接影响结果精度的问题,提出一种基  
于卷积神经网络的流量分类算法。首先,通过对数据进行归一化处理后映射成灰度图片作为卷积神经网络的输入  
数据,然后,基于 LeNet-5 深度卷积神经网络设计适于流量分类应用的卷积层特征面及全连接层的参数,构造能  
够实现流量的自主特征学习的最优分类模型,从而实现网络流量的分类。所提方法可以在避免复杂显式特征提取  
的同时达到提高分类精度的效果。通过公开数据集和实际数据集的系列仿真实验测试结果表明,与传统分类方法  
相比所提算法基于改进的 CNN 流量分类方法不仅提高了流量分类的精度,而且减少了分类所用的时间。  
关键词:流量分类;卷积神经网络;归一化;特征选择  
中图分类号TP393  
文献标识码A  
doi: 10.11959/j.issn.1000-436x.2018018  
Network traffic classification method basing on CNN  
WANG Yong1,2,3, ZHOU Huiyi2,3, FENG Hao1 , YE Miao3,4, KE Wenlong2  
1. School of Computer Science and Information Security, Guilin University of Electronic Technology, Guilin 541004, China  
2. School of Information and Communication, Guilin University of Electronic Technology, Guilin 541004, China  
3. Key Laboratory of Cognitive Radio and Information Processing, Guilin University of Electronic Technology, Guilin 541004, China  
4. Information Science and Technology, Guilin University of Industrial Technology, Guilin 541004, China  
Abstract: Since the feature selection process will directly affect the accuracy of the traffic classification based on the tra-  
ditional machine learning method, a traffic classification algorithm based on convolution neural network was tailored.  
First, the min-max normalization method was utilized to process the traffic data and map them into gray images, which  
would be used as the input data of convolution neural network to realize the independent feature learning. Then, an im-  
proved structure of the classical convolution neural network was proposed, and the parameters of the feature map and the  
full connection layer were designed to select the optimal classification model to realize the traffic classification. The tai-  
lored method can improve the classification accuracy without the complex operation of the network traffic. A series of  
simulation test results with the public data sets and real data sets show that compared with the traditional classification  
methods, the tailored convolution neural network traffic classification method can improve the accuracy and reduce the  
time of classification.  
Key words: network traffic classification, convolutional neural network, normalized, feature selection  
收稿日期2017-10-12修回日期2017-12-19  
通信作者:俸皓,
基金项目家自然科学基金资助项No.61662018, No.61661015国博士后科学基金资助项No.2016M602922XB;  
广西自然科学基金资助项目(No.2016GXNSFAA380153桂林电子科技大学研究生教育创新计划基金资助项目  
No.2018YJCX53, No.2018YJCX20桂林理工大学科研启动基金资助项目(No.GUTQDJJ20172000019)  
Foundation Items: The National Natural Science Foundation of China (No.61662018, No.61661015), Project Funded by  
China Postdoctoral Foundation (No.2016M602922XB), The Natural Science Foundation of Guangxi Autonomous Region  
(No.2016GXNSFAA380153), Innovation Project of Guest Graduate Education (No.2018YJCX53, No.2018YJCX20), Foundation of  
Guilin University of Technology (No.GUTQDJJ20172000019)  
2018018-1  
1 期  
王勇等:基于深度卷积神经网络的网络流量分类方法  
·15·  
降维的方法对网络流量数据的特征进行降维后再  
实现网络流量分类,本文也采用了 PCA 算法对  
Moore 数据集进行特征降维操作后与本文算法进行  
了对比。  
1 引言  
随着大数据时代的到来,新型网络应用不断  
兴起,网络的组成越来越复杂。如何从日益增长  
的流量数据中获得更有价值的信息已经成为各大  
运营商制订发展规划不可或缺的评估指标之一。  
网络流量分类作为网络管理与网络安全的关键技  
术之一,不但能够优化网络配置,降低网络安全  
隐患,而且能够根据用户的行为分析提供更好的  
服务质量。目前,基于机器学习的流量分类方法  
一直是研究者关注的热点,应用在网络流量分类  
领域的机器学习算法可以分为浅层学习和深度学  
[1]2 种。  
近年来,深度学习在图像识别[10]、语音识别[11]  
音频处理[12]和自然语音处理[13]等各大领域均有应  
用并取得了很好的成绩。深度学习主要包括深度置  
信网络、卷积神经网络和递归神经网络等。文献[14]  
通过使用 WK-ELM 算法中的 GA 技术来获取神经  
网络最合适的参数值,以及使用极端学习机的优  
化方法所提供隐含层的单元数量,来增加正确分类  
的准确率。该方法很好地解决了神经网络中参数  
选取的问题,针Moore数据集进行流量分类达到  
96.57%的准确率。但是该分类方法是一个静态  
的分类过程,需要根据当前样本人工选取节点数  
和参数,即只能一次性地完成训练,一旦训练过  
程样本发生变化,就要重新开始训练,无法动态  
更新参数和训练样本。面对动态的批量的分类过  
程,会浪费大量的时间来更新参数和样本。文献[15]  
针对 P2P 流量分类准确率较低的问题,提出一种基  
于深度学习结构、半监督的深度置信网络(DBN,  
deep belief networks)流量分类方法,构造 P2P 流  
量合适的特征空间,建立基于 DBN 的网络流量分  
类模型,并对模型的隐含节点个数和隐含层个数  
进行选择,提高 DBN 模型对 P2P 流量的分类准确  
率。但是该方法在构造数据集的阶段就需要进行  
特征提取,且采用 DBN 模型进行流量分类计算  
过于复杂以满足实际应用中的实时性需求。文  
[14,15]在实验中取得的成功,证明了深度学习在  
流量分类上的可行性。相对于经典的机器学习方  
法,在训练数据发生变化的时候,基于深度学习  
的分类模型可以在其原有最优模型的基础上进行  
微调,生成新的最优分类模型完成流量分类。而  
基于机器学习的分类模型需要对变化的训练数据  
重新进行特征提取和训练学习,完成对新数据的  
流量分类。  
浅层学习主要包括:支持向量机、决策树[2,3]  
贝叶斯[4]k-means[5]等。文献[6]创建了一个跨越  
多天的 WLAN 数据集,包括多种流量类型和应用  
程序,从数据中提取 63 个特征并用于训练 6 种不  
同的机器学习算法。文献[7]提出了使用流程级特  
征实现在线流量分类的算法和架构。首先,设计  
了基于 C4.5 策树算法和熵 MDLminimum  
description length散化算法的流量分类器对 8 个  
主要应用进行分类,总体精度达到 97.92%。其  
次,将离散化算法和 FPGA(现场可编程门阵列)  
以及多核平台分类器进行合并的方法,实现分类  
器的优化。无论文献[6]还是文献[7]均是通过人工  
选择和组合特征的方法实现最终的流量分类,增  
加了网络流量分类的工作量。文献[8]使用小波领  
导 者 多 分 形 式 主 义 ( WLMF, wavelet leaders  
multifractal formalism网络流中提取多重分形特  
征来描述网络流量,然后,将基于主成分分析  
PCA, principal component analysis特征选择方  
法应用于这些多重分形特征以消除不相关和冗余  
特征。实验结果表明与现有的基于机器学习的方  
法中研究的传输层数据特征相比,支持向量机  
SVM, support vector machine分类准确性显著  
提高。文献[9]提出了一种 SPP-SVM 的实时精确  
SVM 训练模型。该模型首先通过 PCA 对数据进行  
特征提取,降低原有特征的维度,然后,通过采用  
一种改进的粒子群优化算法自动搜索核函数的最  
优工作参数,使其与传统的 SVM 相比,可以通过  
少量的训练样本就能显著的提高流量分类的精  
度。文献[9]还通过同时对所有数据进行数值缩放  
操作来减小工作计算量。文献[8,9]均采用了 PCA  
针对以上研究中出现的问题,本文提出了基  
于 离 差 标 准 化 的 卷 积 神 经 网 络 ( MMN-CNN,  
min-max normalization convolutional neural network,  
该方法可以隐性地从训练数据中进行网络学习并  
提取特征,不仅避免了人工特征选取的麻烦,很  
好地解决了不同分类算法对特征选取的差异性,  
而且提高了流量分类的精度。  
2018018-2  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载