面向流量识别的流模式自动生成技术

面向流量识别的流模式自动生成技术

论文摘要

网络流量识别在网络规划,网络管理,流量监控,安全检测等方面起着重要的作用,当前存在着多种流量识别的方法,流模式较好地融合了多种方法,得到了一种统一描述流的方式。大部分现有的流量识别都需要一个先验知识库,知识库的生成是一个人工费时费力的过程。自动化的流量识别是流量识别发展的趋势。基于流模式,提出了一个流模式自动生成的框架。在预分流的基础上,首先区分加密流量和非加密流量,对于非加密流量,提取其载荷特征;对于加密流量,提取其统计特征。最后生成能识别此流量的流模式。本论文主要完成了以下工作:1.提出了一种区分加密流量与非加密流量的方法。从信息论中熵的理论出发,利用密码算法随机性测试来区分加密流量与非加密流量。加密流量和非加密流量的区分为统一的流量识别自动化奠定了基础,克服了单一的流量识别自动化技术的应用范围限制。2.对于非加密流量,利用最长公共子串算法来提取应用程序签名。基于字符串匹配中的LCS(Longest Common Substring)算法,自动从载荷中提取签名。克服了手动协议分析耗时耗力的缺点。3.对于加密流量,研究了机器学习算法在加密流量识别中的应用。以K-means聚类算法为实验对象,实验结果表明了在选取恰当的K值和中心后,K-means算法的快速性和有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 基本概念
  • 1.3 研究现状
  • 1.4 研究意义
  • 1.5 论文的组织结构
  • 第二章 流量识别技术
  • 2.1 基于端口的识别方法
  • 2.2 基于载荷特征的识别方法
  • 2.3 基于统计特征的流量识别方法
  • 2.4 流模式匹配技术
  • 2.5 本章小结
  • 第三章 机器学习算法研究与分析
  • 3.1 机器学习介绍
  • 3.2 主要的聚类方法
  • 3.2.1 划分聚类方法
  • 3.2.2 层次聚类方法
  • 3.2.3 密度聚类方法
  • 3.2.4 网格聚类方法
  • 3.2.5 模型聚类方法
  • 3.3 聚类算法的比较
  • 3.4 本章小结
  • 第四章 流模式自动生成技术
  • 4.1 流模式自动生成框架设计
  • 4.2 加密流量与非加密流量的区分
  • 4.2.1 熵的概念
  • 4.2.2 伪随机码
  • 4.2.3 密码算法的随机性检测
  • 4.3 签名的自动生成
  • 4.3.1 LCS算法介绍
  • 4.3.2 LCS算法实现原理
  • 4.4 基于K-means的聚类分析
  • 4.4.1 K-means算法基本思想
  • 4.4.2 K值的选取
  • 4.5 本章小结
  • 第五章 功能测试
  • 5.1 加密流量与非加密流量的区分功能测试
  • 5.1.1 NIST测试标准
  • 5.1.2 NIST测试及分析
  • 5.2 LCS算法实验与分析
  • 5.3 K-means算法实验与分析
  • 5.3.1 Netmate和Weka机器学习平台
  • 5.3.2 实验过程及分析
  • 5.4 本章小结
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 发表论文及科研情况
  • 附录A LCS(Longest Common Substring)算法
  • 相关论文文献

    标签:;  ;  ;  ;  

    面向流量识别的流模式自动生成技术
    下载Doc文档

    猜你喜欢