网络流量特征分析与特征选择

网络流量特征分析与特征选择

论文摘要

网络流量分析与分类是网络流量监控最直接有效的方法,具有极其重要的意义,现在已经被应用于QoS保障、网络安全监控、计费等很多领域。但是随着高速网络技术的快速发展,尤其是G比特和T比特技术的出现,网络承载的数据流量越来越大,传统的流量分类方法因不能同时满足流量分类的准确性和即时性而变得越发不适用。因此,近年来研究者们将更多的精力投入到寻找新的流量分类方法,使之既能保证分类准确度,又能适用于高吞吐量的网络环境中。为实现该目的,本文对基于特征选择技术的高速网络流量分类技术进行了探究。特征选择是机器学习领域中一项重要技术。它通过移除原始数据集中与类不相关的或者是多余的特征,来简化分类过程中模型的建立,从而达到降低分类计算复杂度的目的。本文首先基于实验室自主开发的流量分析分类系统,对ADSL和CDMA两种网络环境下的P2Pstream业务的流属性统计特征进行了详细分析。随后,本文使用ADSL和CDMA现网流量数据作为支撑,对基于特征选择技术的流量分类效果进行了深入探究。研究结果表明使用适当的特征选择方法,可以在保证分类准确性的前提下大大简化分类复杂性,降低资源消耗。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究意义
  • 1.3 论文内容及结构
  • 第二章 常用网络流量特征及流量分类方法
  • 2.1 流量特征的分类
  • 2.2 常用流量分类方法
  • 2.2.1 基于应用层签名的识别分类方法
  • 2.2.2 基于流量特征的识别分类方法
  • 2.2.3 基于流属性统计特征的识别分类方法
  • 第三章 P2PStream的流属性统计特征分析
  • 3.1 开发系统介绍
  • 3.1.1 系统整体架构
  • 3.1.2 回放统计模块
  • 3.1.3 报文长度分布统计子模块
  • 3.1.4 报文到达间隔分布统计子模块
  • 3.2 ADSL和CDMA数据描述
  • 3.3 P2PStream的报文长度分布分析
  • 3.3.1 ADSL网络下的报文长度分布
  • 3.3.2 CDMA网络下的报文长度分布
  • 3.3.3 ADSL、CDMA网络下的报文长度分布比较
  • 3.4 P2PStream的报文到达间隔分布分析
  • 3.4.1 ADSL网络下的报文到达间隔分布
  • 3.4.2 CDMA网络下的报文到达间隔分布
  • 3.4.3 ADSL、CDMA网络下的报文到达间隔分布比较
  • 第四章 特征选择技术
  • 4.1 特征选择技术概述
  • 4.1.1 基本原理
  • 4.1.2 搜索的起点和方向
  • 4.1.3 搜索策略
  • 4.1.4 评价函数
  • 4.1.5 收敛准则
  • 4.2 启发式搜索策略
  • 4.2.1 Greedy Climb
  • 4.2.2 Best First
  • 4.3 基于相关性的特征选择方法
  • 4.3.1 基本原理
  • 4.3.2 特征相关性计算
  • 4.4 基于一致性的特征选择方法
  • 4.5 C4.5决策树
  • 4.6 分类器评价标准
  • 第五章 基于特征选择方法的流量分类实验
  • 5.1 数据集描述
  • 5.1.1 数据的采集
  • 5.1.2 数据的采样
  • 5.2 实验中用到的流属性统计特征
  • 5.2.1 长度属性特征
  • 5.2.2 时间属性特征
  • 5.2.3 数量属性特征
  • 5.2.4 社会属性特征
  • 5.3 CDMA数据的分类
  • 5.3.1 数据预处理
  • 5.3.2 实验过程与分析
  • 5.3.3 实验结论
  • 5.4 ADSL数据的分类
  • 5.4.1 数据预处理
  • 5.4.2 实验过程与分析
  • 5.4.3 实验结论
  • 总结与展望
  • 致谢
  • 参考文献
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    标签:;  ;  ;  ;  

    网络流量特征分析与特征选择
    下载Doc文档

    猜你喜欢