快速流分类的相关问题研究

快速流分类的相关问题研究

论文摘要

随着新一代互联网技术在中国的迅速发展,互联网的规模不断扩大,业务类型不断增加。据统计,截至2010年12月底,中国网民规模达到4.57亿人,互联网普及率达34.3%。一方面,网络信息量的膨胀,使得网络流量呈现指数级增长的趋势,加剧了网络拥塞状况的发生,导致网络服务质量急剧下降,影响用户的满意度。另一方面,种类繁多的业务类型不但吞噬着越来越多的网络资源,而且给网络安全带来了巨大的威胁。为了能够更好的掌握网络中流量的行为状况,网络管理者需要对网络流量进行可靠、有效的监测与控制,并对网络所承载的各类业务进行及时、准确的分析。而实现这些的前提和基础是对网络流量进行快速准确的识别和分类。根据网络原理的知识,网络应用的一次交互生成的IP报文都具有相同的五元组(源地址,源端口,目的地址,目的端口,协议),反之,一段时间内具有相同五元组的IP报文一定属于同种应用类型。因此目前分类领域通行的做法是先基于五元组将IP报文聚类成流,然后基于流做分类。与早期基于报文分类相比,流分类大大降低了分类动作的次数;另一方面,流中包含更为丰富的信息。综上所述,本文研究基于流的快速分类技术。显著的分类特征和合适的分类器是影响流分类效果的两个主要因素,本文即从这两个方面展开研究。首先,研究了分类特征的问题,提出了ACK-Len ab和ACK-Len ba特征。其中,ACK-Len ab是指请求方在收到对方第一个ACK响应包之前所发送的数据长度的总和;ACK-Len ba是指响应方在收到对方第一个ACK响应包之前所发送的数据长度的总和。分析和实验表明,这两个特征具有典型性,利用它们做分类,具有良好的分类效果。同时,这两个特征的计算仅用到流中前几个数据包的大小信息,能够在流到达初期就对其进行分类,同时该方法仅需存储前几个包的数据信息,因此大大节约了机器的存储空间,为实现真正在的在线分类提供了新的思路。其次,研究了分类器的问题。直觉上,特征数越少,分类时要做的判定和计算动作就越少。因此,基于特征约简和传统分类方法相结合建立分类器的思想,提出基于粗糙集的快速流分类方法。该方法是首先使用粗糙集算法对数据集进行特征约简,然后在约简的特征集上采用贝叶斯网络建立分类模型。实验表明,粗糙集方法与贝叶斯网络相结合可以达到最佳的分类效果,且在约简后的特征子集上进行分类,分类器在分类速度和分类精确度方面都有了很大的提高。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 研究目标与研究内容
  • 1.4 论文组织结构
  • 第2章 流量分类技术综述
  • 2.1 引言
  • 2.2 流量分类概念
  • 2.2.1 流量分类的定义
  • 2.2.2 流量分类评价指标
  • 2.3 流量分类方法
  • 2.3.1 基于端口的分类方法
  • 2.3.2 基于应用签名的分类方法
  • 2.3.3 基于统计特征的分类方法
  • 2.4 流量分类中的机器学习方法
  • 2.4.1 有监督机器学习方法
  • 2.4.2 无监督机器学习方法
  • 2.4.3 半监督机器学习方法
  • 2.5 各类方法的比较
  • 2.6 本章小结
  • 第3章 面向快速流分类的特征研究
  • 3.1 Moore流特征集
  • 3.2 ACK-Len ab和ACK-Len ba特征
  • 3.2.1 ACK-Len ab和ACK-Len ba特征的定义
  • 3.2.2 ACK-Len ab和ACK-Len ba特征的典型性分析
  • 3.2.3 实验
  • 3.3 基于ACK-Len ab和ACK-Len ba特征分类的时间性能
  • 3.4 实验中的程序实现
  • 3.4.1 聚包成流
  • 3.4.2 ACK-Len ab和ACK-Len ba特征的计算
  • 3.5 本章小结
  • 第4章 基于粗糙集方法的快速流分类
  • 4.1 特征选择
  • 4.2 粗糙集理论基础
  • 4.2.1 粗糙集基本概念
  • 4.2.2 基于粗糙集的特征选择算法
  • 4.3 基于粗糙集的快速流分类方法
  • 4.4 实验
  • 4.4.1 数据准备
  • 4.4.2 特征选择
  • 4.4.3 实验结果与分析
  • 4.5 本章小结
  • 第5章 总结与展望
  • 5.1 总结
  • 5.2 下一步工作展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表论文
  • 相关论文文献

    • [1].基于深度报文检测和机器学习的加密流量识别方法[J]. 计算机产品与流通 2020(10)
    • [2].基于新型网络结构流量识别方法研究[J]. 电脑编程技巧与维护 2018(04)
    • [3].对等网络流量识别技术研究[J]. 中国新通信 2017(05)
    • [4].网络加密流量识别研究综述及展望[J]. 通信学报 2016(09)
    • [5].网络流量识别特征码自动提取系统分析[J]. 计算机光盘软件与应用 2014(19)
    • [6].网络流量识别方法及比较研究[J]. 今日科苑 2015(08)
    • [7].互联网流量识别技术的研究及实现[J]. 广东通信技术 2008(03)
    • [8].特殊网络流量识别综述[J]. 电脑知识与技术 2018(17)
    • [9].电力信息通信网络流量识别技术研究[J]. 信息化研究 2015(01)
    • [10].基于机器学习的流量识别技术综述与展望[J]. 计算机工程与科学 2018(10)
    • [11].基于数据流多维特征的移动流量识别方法研究[J]. 四川大学学报(自然科学版) 2020(02)
    • [12].网络协议流量识别方法研究[J]. 郑州大学学报(理学版) 2019(04)
    • [13].一种基于相似度的高效网络流量识别方案[J]. 山东大学学报(理学版) 2014(09)
    • [14].非平衡网络流量识别方法[J]. 计算机应用 2018(01)
    • [15].基于有督导机器学习的网络流量识别系统[J]. 现代电子技术 2015(21)
    • [16].基于支持向量机的加密流量识别方法[J]. 东南大学学报(自然科学版) 2017(04)
    • [17].基于卷积神经网络的网络流量识别技术研究[J]. 四川大学学报(自然科学版) 2017(05)
    • [18].基于载荷特征的P2P流量识别方法[J]. 中国科技信息 2014(12)
    • [19].基于卷积神经网络的加密流量识别方法[J]. 南京邮电大学学报(自然科学版) 2018(06)
    • [20].一种EPON串接前端的设计与实现[J]. 光通信研究 2019(01)
    • [21].P2P流量监测系统的设计[J]. 电子设计工程 2016(11)
    • [22].基于特征分析的家庭网络流量识别与系统实现[J]. 计算机工程与应用 2015(10)
    • [23].基于信息熵的流量识别方法[J]. 计算机工程 2009(20)
    • [24].基于神经网络的变电站异常网络流量识别[J]. 信息技术 2020(05)
    • [25].电力信息通信网络流量识别技术探讨[J]. 通讯世界 2016(12)
    • [26].基于DPI的流量识别系统的开发与设计[J]. 数字通信世界 2019(04)
    • [27].数据中心中面向光互联的流量识别与调度研究[J]. 通信学报 2018(09)
    • [28].P2P流量识别技术的研究[J]. 民营科技 2013(12)
    • [29].P2P业务流量识别与系统部署方案研究[J]. 邮电设计技术 2009(06)
    • [30].面向未知协议的流量识别技术研究[J]. 信息网络安全 2019(10)

    标签:;  ;  ;  ;  ;  

    快速流分类的相关问题研究
    下载Doc文档

    猜你喜欢