论文摘要
P2P网络技术的飞速发展,引起文件共享和流媒体业务不断壮大,极大地丰富了互联网的内容,但其巨大的流量和较高的带宽占用对其他网络服务构成了严重威胁。然而仅仅靠增大带宽并不能缓解网络拥塞的状况。因此,实现对P2P流量有效准确的识别成为了当前亟待解决的问题,它对于有效管理网络和合理利用网络资源都具有重要意义。本论文首先介绍了P2P概念,对国内外P2P流量识别的方法进行了分析比较。然后,本论文从数据包、数据流以及连接三个层面分别对目前网络流行的四种P2P应用(Emule、BitTorrent、PPLive、PPstream)以及传统非P2P应用的流量特征进行了统计分析,选取正向连接与反向连接、平均数据包长度、上行流量占总流量比例、TCP流量占总流量的比例作为流量识别的四个基本流量特征:P2P流量和非P2P流量的前三个特征来两者都有各自的相对独立的波动区间;虽然4种P2P流量的中间两个特征波动区间有所重叠,但同为文件共享的BT和Emule之间,同为流媒体传输的PPLive和PPSream之间,都有所不同;虽然PPSream和PPLive的第四个特征非常相似,但它们与BT、Emule之间则有很大的区别。利用Fuzzy ARTMAP(fuzzy adaptive resonance theory map,模糊自适应共振理论映射)神经网络支持任意维模拟输入输出空间之间的映射、能快速稳定的在线识别学习的特点,提出了一种基于Fuzzy ARTMAP神经网络的P2P流量识别方法:首先,进行流量采集分为训练样本集和测试样本集;然后,对样本集进行特征提取并且归一化特征值生成特征向量;接着,利用训练样本对基于Fuzzy ARTMAP的分类器进行训练学习;最后,用训练学习好的分类器对测试样本进行测试识别。实验表明:当选取正向连接与反向连接、平均数据包长度、上行流量占总流量比例三个特征进行两级分类时候, P2P流量的识别准确率达到98%,对匿名P2P流量识别准确率也达到了96%;当加入TCP流量占总流量的比例特征进行多级应用分类时,平均准确率可达96%,平均虚警率只为1.5%。实验结果表明该方法具有可扩展性,能进行多级应用分类,能有效识别匿名P2P流量。
论文目录
相关论文文献
- [1].基于Fuzzy ARTMAP的CC区多金属结核资源定量评价[J]. 海洋地质与第四纪地质 2013(02)
- [2].基于混合fuzzy ARTMAP的智能诊断方法在油缸泄漏诊断中的应用[J]. 中国科技论文 2016(10)