基于决策树的网络流量分类研究

基于决策树的网络流量分类研究

论文摘要

网络流量分类技术作为网络管理、流量工程以及安全检测等研究课题的基础,其研究具有重要的实用价值。传统的基于端口和基于深度包检测的网络流量分类方法因为p2p及载荷加密等技术的流行而变得失效。基于“网络流”统计特征和机器学习的方法因为能够有效地解决这些问题而成为了流量分类领域的新方向。目前,大多数基于机器学习的流量分类方法以“流分类准确率”为目标,没有考虑流量分类器在“字节分类准确率”的表现。但随着“大象流”、“老鼠流”之间不平衡现象愈演愈烈,“字节分类准确率”更能体现一个分类器的实际流量分类效果。因此,如何在保证“流分类准确率”的前提下尽量提高流量分类器的“字节分类准确率”成为基于机器学习网络流量分类中一个值得研究的课题。本文首次将C4.5 cs决策树算法应用到网络流量的分类当中,并根据流量分类这一实际背景给出了一种计算C4.5 cs代价矩阵的方法。相比其他方法,采用C4.5 cs算法的流量分类器具有更高的“字节分类准确率”,适合于不平衡流量的分类。由于网络流特征中存在一些无效特征和冗余特征,本文将特征选择算法引入网络流量的分类当中。结合所使用的分类算法,论文提出了一种结合卡方统计量、C4.5 cs算法和遗传搜索策略的特征选择算法。实验结果证明,在引入了本文特征选择算法之后,C4.5 cs算法分类网络流的速度提高了近2倍。最后,在NetMate和Weka的基础上,我们设计并实现了一个基于C4.5 cs算法的网络流量分类原型系统——NTFCS,并对NTFCS的流量采集器、中心分类器以及数据存储器的主要模块和关键实现技术进行了简要的介绍。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 论文的研究背景和研究意义
  • 1.2 国内外研究现状
  • 1.3 论文的主要研究内容
  • 1.4 论文的组织结构
  • 第二章 网络流量分类模型
  • 2.1 网络流量分类模型的比较
  • 2.1.1 基于端口的网络流量分类模型局限性
  • 2.1.2 基于深度包检测(DPI)的网络流量分类模型局限性
  • 2.1.3 基于机器学习的网络流量分类模型的优势
  • 2.2 基于机器学习的流量分类
  • 2.2.1 用于机器学习的流量特征数据
  • 2.2.2 网络流的定义
  • 2.2.3 机器学习简介
  • 2.2.4 基于机器学习的流量分类模型
  • 2.3 决策树分类模型
  • 2.3.1 决策树表示
  • 2.3.2 决策树的构造过程
  • 2.3.3 构造决策树的关键步骤
  • 2.3.4 决策树的优缺点
  • 2.4 本章小结
  • 第三章 基于代价敏感决策树的网络流量分类
  • 3.1 不平衡网络流量的分类
  • 3.1.1 网络流量的不平衡现象
  • 3.1.2 不平衡现象对流量分类的影响
  • 3.1.3 提高字节分类准确率的方法
  • 3.2 基于代价敏感决策树的网络流量分类
  • cs算法'>3.2.1 C4.5cs算法
  • cs算法的流量分类'>3.2.2 基于C4.5cs算法的流量分类
  • 3.3 试验以及结果分析
  • 3.3.1 实验数据
  • 3.3.2 实验评价标准
  • 3.3.3 实验及结果分析
  • 3.4 本章小结
  • 第四章 基于特征选择的C4.5 cs网络流量分类
  • 4.1 引入特征选择的必要性
  • 4.2 特征选择的基本理论
  • 4.2.1 特征选择定义
  • 4.2.2 特征选择的基本模型
  • 4.2.3 特征选择常用搜索技术
  • 4.3 结合卡方统计量、C4.5 cs和遗传算法搜索的特征选择算法
  • 4.3.1 采用卡方统计量来去除不相关特征
  • 4.3.2 结合C4.5 cs算法与遗传算法的特征寻优
  • 4.4 基于C4.5 cs和特征选择的流量分类
  • 4.4.1 实验及结果分析
  • 4.5 本章小结
  • 第五章 网络流量分类原型系统的设计与实现
  • 5.1 系统总体设计
  • 5.1.1 系统设计
  • 5.1.2 流量采集部署
  • 5.2 流记录采集器的实现
  • 5.2.1 基于NetMate的流记录采集框架
  • 5.2.2 网络流特征计算
  • 5.2.3 网络流特征输出
  • 5.2.4 流记录采集器的配置
  • 5.3 中心分类器的实现
  • 5.3.1 中心分类器的设计
  • 5.3.2 模型训练算法的实现
  • 5.4 数据存储的实现
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 论文总结
  • 6.2 进一步研究方向
  • 参考文献
  • 致谢
  • 攻读学位期间主要的研究成果
  • 相关论文文献

    • [1].基于优化决策树的智能故障诊断方法研究[J]. 广东水利电力职业技术学院学报 2020(01)
    • [2].基于赤池信息准则的分类回归决策树剪枝算法[J]. 计算机应用 2014(S2)
    • [3].浅析决策树对犯罪风险程度的预测[J]. 科技风 2019(02)
    • [4].基于改进决策树的故障诊断方法研究[J]. 成都信息工程大学学报 2018(06)
    • [5].模型决策树:一种决策树加速算法[J]. 模式识别与人工智能 2018(07)
    • [6].基于样本对的极小决策树构建[J]. 北京信息科技大学学报(自然科学版) 2015(03)
    • [7].边画边算的决策树实战[J]. 中国信息技术教育 2020(Z4)
    • [8].基于最大间隔的决策树归纳算法[J]. 科技信息 2011(25)
    • [9].基于最大间隔的决策树归纳算法[J]. 科技视界 2011(01)
    • [10].基于改进的代价敏感决策树的网络贷款分类[J]. 计算机应用 2019(10)
    • [11].不一致数据上精确决策树生成算法[J]. 软件学报 2017(11)
    • [12].基于加权多决策树的入侵检测系统模型研究[J]. 计算机安全 2009(08)
    • [13].基于核属性的决策树构造算法研究[J]. 滁州学院学报 2008(06)
    • [14].基于决策树的设备预测性维护[J]. 数字通信世界 2018(08)
    • [15].贝叶斯的决策树剪枝算法在学科评审中的研究[J]. 计算机工程与设计 2013(11)
    • [16].基于多决策树的RFID入侵检测模型[J]. 计算机应用研究 2014(04)
    • [17].基于决策树的财务危机预警研究[J]. 财会通讯 2011(17)
    • [18].浅谈随机决策树[J]. 电脑知识与技术 2009(25)
    • [19].一种懒惰式决策树和普通决策树结合的分类模型——半懒惰式决策树[J]. 计算机应用与软件 2008(12)
    • [20].基于不同决策树的面向对象林区遥感影像分类比较[J]. 应用生态学报 2018(12)
    • [21].基于伪梯度提升决策树的内网防御算法[J]. 计算机科学 2018(04)
    • [22].基于决策树的游客意向及旅游建议的研究[J]. 现代计算机(专业版) 2018(12)
    • [23].基于多源不确定物体的研究[J]. 湖南工程学院学报(自然科学版) 2018(03)
    • [24].基于决策树的日志分析方法[J]. 软件导刊 2020(01)
    • [25].基于决策树判别的高温目标遥感识别方法[J]. 科学技术与工程 2019(11)
    • [26].决策树多元分类模型预测森林植被覆盖[J]. 电子制作 2017(24)
    • [27].基于加权划分非平衡决策树的诗歌朗读情感度分析[J]. 计算机科学 2020(S2)
    • [28].非相容表决策树构建算法[J]. 河海大学学报(自然科学版) 2013(02)
    • [29].有序决策树的比较研究[J]. 计算机科学与探索 2013(11)
    • [30].一种基于决策树的选择查询算法[J]. 中国科技信息 2012(03)

    标签:;  ;  ;  

    基于决策树的网络流量分类研究
    下载Doc文档

    猜你喜欢