论文摘要
网络流量识别在网络规划,网络管理,流量监控,安全检测等方面起着重要的作用,当前存在着多种流量识别的方法,流模式较好地融合了多种方法,得到了一种统一描述流的方式。大部分现有的流量识别都需要一个先验知识库,知识库的生成是一个人工费时费力的过程。自动化的流量识别是流量识别发展的趋势。基于流模式,提出了一个流模式自动生成的框架。在预分流的基础上,首先区分加密流量和非加密流量,对于非加密流量,提取其载荷特征;对于加密流量,提取其统计特征。最后生成能识别此流量的流模式。本论文主要完成了以下工作:1.提出了一种区分加密流量与非加密流量的方法。从信息论中熵的理论出发,利用密码算法随机性测试来区分加密流量与非加密流量。加密流量和非加密流量的区分为统一的流量识别自动化奠定了基础,克服了单一的流量识别自动化技术的应用范围限制。2.对于非加密流量,利用最长公共子串算法来提取应用程序签名。基于字符串匹配中的LCS(Longest Common Substring)算法,自动从载荷中提取签名。克服了手动协议分析耗时耗力的缺点。3.对于加密流量,研究了机器学习算法在加密流量识别中的应用。以K-means聚类算法为实验对象,实验结果表明了在选取恰当的K值和中心后,K-means算法的快速性和有效性。
论文目录
摘要ABSTRACT第一章 绪论1.1 研究背景1.2 基本概念1.3 研究现状1.4 研究意义1.5 论文的组织结构第二章 流量识别技术2.1 基于端口的识别方法2.2 基于载荷特征的识别方法2.3 基于统计特征的流量识别方法2.4 流模式匹配技术2.5 本章小结第三章 机器学习算法研究与分析3.1 机器学习介绍3.2 主要的聚类方法3.2.1 划分聚类方法3.2.2 层次聚类方法3.2.3 密度聚类方法3.2.4 网格聚类方法3.2.5 模型聚类方法3.3 聚类算法的比较3.4 本章小结第四章 流模式自动生成技术4.1 流模式自动生成框架设计4.2 加密流量与非加密流量的区分4.2.1 熵的概念4.2.2 伪随机码4.2.3 密码算法的随机性检测4.3 签名的自动生成4.3.1 LCS算法介绍4.3.2 LCS算法实现原理4.4 基于K-means的聚类分析4.4.1 K-means算法基本思想4.4.2 K值的选取4.5 本章小结第五章 功能测试5.1 加密流量与非加密流量的区分功能测试5.1.1 NIST测试标准5.1.2 NIST测试及分析5.2 LCS算法实验与分析5.3 K-means算法实验与分析5.3.1 Netmate和Weka机器学习平台5.3.2 实验过程及分析5.4 本章小结第六章 总结与展望6.1 总结6.2 展望致谢参考文献发表论文及科研情况附录A LCS(Longest Common Substring)算法
相关论文文献
标签:流量识别论文; 流模式论文; 加密流量论文; 自动生成论文;