基于多步投机的正则表达式匹配算法的研究

基于多步投机的正则表达式匹配算法的研究

论文摘要

网络防御系统(Intrusion Detection and Prevention Systems,IPS)是维护网络安全的有效方式。IPS的核心是深度数据包检测(Deep Packet Inspection,DPI)。现在网络在以极快的速度发展。IPS的性能要跟上线速需要借助多核或者硬件技术。由于正则表达式的表达能力更强更灵活,特征规则多用正则表达式匹配算法实现匹配。正则表达式匹配算法用有限自动机来完成。有限自动机分为确定有限自动机(Deterministic Finite Automata,DFA)和非确定有限自动机(NondeteministicFinite Automata,NFA)。DFA较NFA匹配速率更快,更常用。但是DFA的处理速率还是难以满足线速处理的要求,特别是DFA每次只能匹配一个字符产生延时成为IPS的性能瓶颈。因此,研究基于DFA的高效正则表达式匹配算法具有重要意义。接着,本文介绍了几种基于硬件的正则表达式匹配算法,如基于多核技术的投机正则表达式匹配算法(Speculative Parallel Pattern Matching, SPPM)等,并分析了它们的理论依据及算法关键,还指明了各自的优点及不足。针对上述算法的不足之处,通过分析和实验验证Snort规则集特征,本文在正则表达式匹配算法中运用到“投机”的概念,辅以多核技术,将输入字符串分为多段并行匹配,如果投机失败会在后期进行纠正。围绕提高投机成功率这个算法关键问题,本文提出了基于多步投机的正则表达式匹配算法(Regular ExpressionMatching with Muti-step Speculation, MSPPM),有效提高投机成功率,缩短了并行匹配外对DFA的访问次数,减少延时。通过仿真比较实验可见,MSPPM的并行迭代次数和访问DFA的次数相对SPPM减少约15%,从而进一步缩短匹配时由访问DFA产生的内存延时。时间性能方面,MSPPM相对传统DFA算法的加速率平均提高约15%,算法匹配速率更高。所以,MSPPM算法是一种低延时高效的基于多核技术的正则表达式匹配算法,可达到提高匹配效率和系统吞吐量的目的,可使IPS更好的适应网络的发展。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.2 研究内容
  • 1.3 论文结构
  • 第2章 相关理论及研究综述
  • 2.1 引言
  • 2.2 正则表达式及其相关定义
  • 2.3 传统正则表达式算法
  • 2.3.1 自动有限机
  • 2.3.2 NFA 算法
  • 2.3.3 DFA 算法
  • 2.4 正则表达式匹配算法发展介绍
  • 2.4.1 多模式匹配算法
  • 2.4.2 DFA 改进算法
  • 2.4.3 基于硬件的快速正则表达式匹配算法
  • 2.5 小结
  • 第3章 基于多步投机的正则表达式匹配算法
  • 3.1 引言
  • 3.2 投机算法理论
  • 3.2.1 投机及投机算法简介
  • 3.2.2 传统 DFA 算法的局限性
  • 3.2.3 投机 DFA 匹配算法
  • 3.2.4 投机算法理论
  • 3.3 已有投机正则表达式匹配算法存在的问题
  • 3.4 基于多步投机的正则表达式匹配算法思想
  • 3.5 基于多步投机的匹配算法原理
  • 3.5.1 活跃状态
  • 3.5.2 规则特征
  • 3.5.3 选择投机
  • 3.6 MSPPM 算法设计
  • 3.6.1 双核 MSPPM 算法设计
  • 3.6.2 单核 MSPPM 算法设计
  • 3.6.3 算法复杂度分析比较
  • 3.7 小结
  • 第4章 性能分析与仿真实验
  • 4.1 引言
  • 4.2 SPPM 算法和 MSPPM 算法性能分析及比较
  • 4.3 仿真实验及结果
  • 4.3.1 实验环境
  • 4.3.2 准备工作
  • 4.3.3 双核仿真比较实验
  • 4.3.4 单核仿真比较实验
  • 4.4 小结
  • 结论
  • 参考文献
  • 致谢
  • 附录A 攻读硕士学位期间所发表的学术论文目录
  • 相关论文文献

    • [1].雷达模拟视频与电子海图叠加匹配算法[J]. 舰船科学技术 2020(14)
    • [2].基于形状匹配算法的零件定位模型研究[J]. 洛阳师范学院学报 2019(08)
    • [3].无方向的三角形匹配指纹识别[J]. 中国图象图形学报 2017(09)
    • [4].基于门控循环单元模型的在线路网匹配算法[J]. 华东师范大学学报(自然科学版) 2020(06)
    • [5].最大匹配算法在校园网信息提取中的应用[J]. 洛阳师范学院学报 2015(08)
    • [6].最大匹配算法研究[J]. 微型机与应用 2012(08)
    • [7].一种用于入侵检测系统的可变r匹配算法[J]. 计算机应用研究 2010(02)
    • [8].树匹配算法在网页分类中的应用[J]. 电脑学习 2010(04)
    • [9].产生式系统规则匹配算法研究[J]. 计算机与现代化 2009(11)
    • [10].计算机网络入侵检测系统匹配算法的研究[J]. 电子设计工程 2019(08)
    • [11].基于方向补偿匹配算法和脚跟着地特征的鲁棒步态识别[J]. 西南师范大学学报(自然科学版) 2017(03)
    • [12].高炉料面的分类与案例匹配算法[J]. 控制理论与应用 2017(03)
    • [13].基于线要素动态化简的匹配算法比较与评价[J]. 测绘科学技术学报 2016(01)
    • [14].基于多波束雷达测高的地形高度匹配算法研究[J]. 全球定位系统 2015(02)
    • [15].基于FPGA的布尔匹配算法改进研究[J]. 数字技术与应用 2011(10)
    • [16].低成本列车运行控制系统专用数据库及定位匹配算法[J]. 北京交通大学学报 2010(02)
    • [17].一种新型可变r的动态匹配算法[J]. 计算机工程 2010(10)
    • [18].过滤级服务发现中不同本体间概念匹配算法[J]. 内江师范学院学报 2008(08)
    • [19].非标准双目系统匹配算法适用性研究[J]. 大连大学学报 2019(06)
    • [20].井下地磁定位的匹配算法分析和优化[J]. 传感技术学报 2018(09)
    • [21].基于决策树的景象匹配算法性能评估方法研究[J]. 计算机与数字工程 2016(11)
    • [22].一种改进的中文分词正向最大匹配算法[J]. 计算机应用与软件 2011(03)
    • [23].基于内容的快速事件匹配算法[J]. 通信学报 2011(06)
    • [24].两种快速星像匹配算法的比较[J]. 天文研究与技术 2010(02)
    • [25].中文村名俗称与规范名称的匹配算法[J]. 北京测绘 2020(03)
    • [26].有限状态自动机辅助的行人导航状态匹配算法[J]. 测绘学报 2017(03)
    • [27].基于双字哈希结构的最大匹配算法机制改进[J]. 电子设计工程 2017(16)
    • [28].一种标准数据元与数据项匹配算法[J]. 电脑知识与技术 2016(01)
    • [29].一种新的基于局部重力图逼近的组合匹配算法[J]. 地球物理学报 2012(09)
    • [30].一种基于冲突检测的无关联规则集匹配算法[J]. 计算机工程与科学 2010(10)

    标签:;  ;  ;  

    基于多步投机的正则表达式匹配算法的研究
    下载Doc文档

    猜你喜欢