正则表达式匹配中的DFA优化技术研究

正则表达式匹配中的DFA优化技术研究

论文摘要

随着Internet互联网技术的发展,针对应用层的攻击现象越来越多,传统的状态检测防火墙有效性越来越低。防火墙的功能重心从网络层发展到了应用层,因而诞生了深度包检测技术。深度包检测技术不仅检测数据包头部,而且深入到有效载荷,能够发现隐藏在其中的特征。随着深度包检测技术的发展,传统的字符串精确匹配技术逐渐被正则表达式匹配所代替。正则表达式具有字符串所不具备的强大和灵活的表达能力,能够准确地表达出复杂的特征。越来越多的防火墙和入侵检测系统已经使用正则表达式来描述它们的规则。正则表达式匹配可以分为基于NFA的正则表达式匹配与基于DFA的正则表达式匹配。由于DFA与NFA相比更适合在网络应用中使用,我们一般研究基于DFA的正则表达式匹配。虽然DFA具有先天的速度优势,但是匹配消耗空间过大和规则集规模较大时性能下降严重是它的两大缺点。本论文在对现有DFA优化技术深入研究和分析的基础上,提出了DFA分组算法EasyDG和字母表压缩算法SmallAlpha。前者可以提高规则集规模较大时的匹配性能,后者可以大幅减少匹配消耗空间。基于这两个算法,本文设计并实现了基于DFA的正则表达式匹配引擎SmartRE,与普通的DFA引擎相比,优化后的SmartRE在匹配性能与内存消耗方面均有比较出色的表现。最后,论文针对现实中的一种网络安全应用——应用层协议识别,设计并实现了应用层协议解析系统Jupiter。通过使用SmartRE作为核心模块并设置快速通道与慢速通道的匹配策略,Jupiter的匹配性能可以达到具有类似功能的L7-filter的70-80倍。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景及课题意义
  • 1.2 深度包检测技术简介
  • 1.3 国内外研究现状
  • 1.4 论文主要工作及创新点
  • 1.5 论文组织结构及内容安排
  • 第2章 正则表达式匹配
  • 2.1 正则表达式
  • 2.2 基于NFA 的正则表达式匹配
  • 2.3 基于DFA 的正则表达式匹配
  • 2.4 两种实现方式的比较
  • 2.5 选择DFA 引擎的原因
  • 2.6 本章小结
  • 第3章 正则表达式匹配中的DFA 优化技术研究
  • 3.1 DFA 引擎的不足
  • 3.2 优化策略概述
  • 3.3 DFA 分组
  • 3.3.1 分组基础
  • 3.3.2 正则表达式的相互作用
  • 3.3.3 DFA 分组算法
  • 3.4 DFA 结构优化
  • 3.4.1 DDFA
  • 3.4.2 改进的DDFA
  • 3.4.3 HFA
  • 3.5 本章小结
  • 第4章 基于DFA 的正则表达式匹配引擎SMARTRE
  • 4.1 设计背景
  • 4.2 DFA 分组算法EASYDG
  • 4.2.1 算法背景
  • 4.2.2 算法流程
  • 4.2.3 算法描述
  • 4.3 字母表压缩算法SMALLALPHA
  • 4.3.1 算法背景
  • 4.3.2 算法流程
  • 4.3.3 算法描述
  • 4.4 引擎架构设计与实现
  • 4.4.1 RegexToNFA 模块
  • 4.4.2 NFAtoDFA 模块
  • 4.4.3 DFA 优化模块
  • 4.4.4 匹配模块
  • 4.5 实验步骤及结果
  • 4.5.1 实验环境
  • 4.5.2 实验一:EasyDG 算法性能测试
  • 4.5.3 实验二:SmallAlpha 算法性能测试
  • 4.5.4 实验三:SmartRE 性能测试
  • 4.6 本章小结
  • 第5章 应用层协议解析系统JUPITER
  • 5.1 系统简介及主要功能
  • 5.2 整体框架设计
  • 5.3 网络相关子系统
  • 5.3.1 抓包模块
  • 5.3.2 协议解析模块
  • 5.3.3 包分类及流重组模块
  • 5.4 协议识别子系统
  • 5.4.1 识别策略控制模块
  • 5.4.2 快速通道
  • 5.4.3 慢速通道
  • 5.5 结果处理子系统
  • 5.6 实验步骤及结果
  • 5.6.1 实验环境
  • 5.6.2 Jupiter 性能测试
  • 5.7 本章小结
  • 第6章 总结与展望
  • 参考文献
  • 致谢
  • 个人简历、在学期间发表的学术论文与研究成果
  • 相关论文文献

    • [1].基于DFA的雷暴日时间序列分形特征分析[J]. 气象与环境科学 2016(04)
    • [2].基于DFA的海杂波背景下弱目标检测[J]. 数据通信 2017(02)
    • [3].基于DFA方法的中国洪水保险定价研究[J]. 广东金融学院学报 2009(01)
    • [4].基于DFA设计的隔离开关中的塑料件设计探讨[J]. 中国高新区 2017(11)
    • [5].试用DFA分析合水水库年降雨量和入库年径流的趋势特征[J]. 广东水利水电 2008(01)
    • [6].窦性和房性心律失常的DFA分析[J]. 北京生物医学工程 2010(05)
    • [7].基于修正高阶DFA法的股市长期相关性检验[J]. 北京航空航天大学学报(社会科学版) 2010(01)
    • [8].保险公司资产负债管理中DFA模型的构建[J]. 金融教学与研究 2010(05)
    • [9].基于多维有限自动机的DFA改进算法[J]. 通信学报 2015(05)
    • [10].应用直接免疫荧光抗体法(DFA)对媒介蜱、动物伯氏疏螺旋体的检测[J]. 中国卫生检验杂志 2008(03)
    • [11].DFA在海杂波标度特性分析及目标检测中的应用[J]. 信号处理 2013(07)
    • [12].基于DFA和笛卡尔集的数据录入机器人设计与实现[J]. 计算机技术与发展 2019(12)
    • [13].论保险公司资产负债管理的DFA模型[J]. 经济论坛 2011(06)
    • [14].基于DFA的心理测试系统[J]. 科技信息 2009(20)
    • [15].DFA中零件对称度的自动识别算法[J]. 清华大学学报(自然科学版) 2008(04)
    • [16].产险公司资产负债管理的DFA方法实证分析[J]. 福州大学学报(自然科学版) 2008(02)
    • [17].基于矩阵模型表示的DFA的并行化简[J]. 洛阳师范学院学报 2013(05)
    • [18].泵车排量检测的极值增量DFA方法[J]. 振动.测试与诊断 2016(02)
    • [19].基于正则表达式的DFA拆分算法研究[J]. 计算机与数字工程 2012(08)
    • [20].正则表达式的DFA压缩算法[J]. 通信学报 2009(S1)
    • [21].2016 DFA香港青年设计才俊奖(上)[J]. 设计 2017(08)
    • [22].基于HHT和DFA的文峪河径流趋势分析与预测[J]. 西北农林科技大学学报(自然科学版) 2013(08)
    • [23].基于DFA进行规则组合的算法研究[J]. 网络安全技术与应用 2019(08)
    • [24].基于DFA的沪港股市分形特征探讨[J]. 现代商贸工业 2008(06)
    • [25].一种无匹配时间损耗的DFA压缩算法的研究与实现[J]. 电子学报 2020(06)
    • [26].Effects of difructose dianhydride(DFA)-Ⅳ on in vitro fertilization in pigs[J]. The Journal of Biomedical Research 2017(05)
    • [27].基于DFA结构的高速并行正则表达式匹配算法[J]. 小型微型计算机系统 2013(05)
    • [28].基于DFA与眼动实验的割草机造型要素提取与设计[J]. 林业和草原机械 2020(02)
    • [29].识别完全单半群的最少状态DFA[J]. 科学咨询(科技·管理) 2017(09)
    • [30].2019年“DFA设计奖”:突破创意界限、开创新方向[J]. 包装与设计 2020(02)

    标签:;  ;  ;  ;  ;  

    正则表达式匹配中的DFA优化技术研究
    下载Doc文档

    猜你喜欢