论文摘要
网络流量分析与分类是网络流量监控最直接有效的方法,具有极其重要的意义,现在已经被应用于QoS保障、网络安全监控、计费等很多领域。但是随着高速网络技术的快速发展,尤其是G比特和T比特技术的出现,网络承载的数据流量越来越大,传统的流量分类方法因不能同时满足流量分类的准确性和即时性而变得越发不适用。因此,近年来研究者们将更多的精力投入到寻找新的流量分类方法,使之既能保证分类准确度,又能适用于高吞吐量的网络环境中。为实现该目的,本文对基于特征选择技术的高速网络流量分类技术进行了探究。特征选择是机器学习领域中一项重要技术。它通过移除原始数据集中与类不相关的或者是多余的特征,来简化分类过程中模型的建立,从而达到降低分类计算复杂度的目的。本文首先基于实验室自主开发的流量分析分类系统,对ADSL和CDMA两种网络环境下的P2Pstream业务的流属性统计特征进行了详细分析。随后,本文使用ADSL和CDMA现网流量数据作为支撑,对基于特征选择技术的流量分类效果进行了深入探究。研究结果表明使用适当的特征选择方法,可以在保证分类准确性的前提下大大简化分类复杂性,降低资源消耗。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景1.2 研究意义1.3 论文内容及结构第二章 常用网络流量特征及流量分类方法2.1 流量特征的分类2.2 常用流量分类方法2.2.1 基于应用层签名的识别分类方法2.2.2 基于流量特征的识别分类方法2.2.3 基于流属性统计特征的识别分类方法第三章 P2PStream的流属性统计特征分析3.1 开发系统介绍3.1.1 系统整体架构3.1.2 回放统计模块3.1.3 报文长度分布统计子模块3.1.4 报文到达间隔分布统计子模块3.2 ADSL和CDMA数据描述3.3 P2PStream的报文长度分布分析3.3.1 ADSL网络下的报文长度分布3.3.2 CDMA网络下的报文长度分布3.3.3 ADSL、CDMA网络下的报文长度分布比较3.4 P2PStream的报文到达间隔分布分析3.4.1 ADSL网络下的报文到达间隔分布3.4.2 CDMA网络下的报文到达间隔分布3.4.3 ADSL、CDMA网络下的报文到达间隔分布比较第四章 特征选择技术4.1 特征选择技术概述4.1.1 基本原理4.1.2 搜索的起点和方向4.1.3 搜索策略4.1.4 评价函数4.1.5 收敛准则4.2 启发式搜索策略4.2.1 Greedy Climb4.2.2 Best First4.3 基于相关性的特征选择方法4.3.1 基本原理4.3.2 特征相关性计算4.4 基于一致性的特征选择方法4.5 C4.5决策树4.6 分类器评价标准第五章 基于特征选择方法的流量分类实验5.1 数据集描述5.1.1 数据的采集5.1.2 数据的采样5.2 实验中用到的流属性统计特征5.2.1 长度属性特征5.2.2 时间属性特征5.2.3 数量属性特征5.2.4 社会属性特征5.3 CDMA数据的分类5.3.1 数据预处理5.3.2 实验过程与分析5.3.3 实验结论5.4 ADSL数据的分类5.4.1 数据预处理5.4.2 实验过程与分析5.4.3 实验结论总结与展望致谢参考文献攻读学位期间发表的学术论文目录
相关论文文献
标签:特征分析论文; 特征选择论文; 分类器论文; 数据流论文;