基于学习的恶意网页智能检测系统

基于学习的恶意网页智能检测系统

论文摘要

随着互联网的高速发展,网络资源的丰富,互联网用户很多时间都在浏览各类网页,然而大量的网页含有恶意代码,在人们浏览网页的时候,恶意代码就会在不被察觉的情况下侵入用户系统,使用户计算机系统受到感染和破坏。本文简要介绍了恶意代码的相关知识,对网页恶意代码的工作原理进行了分析。我们知道网页呈现的过程,实质就是浏览器执行代码的过程,那么只要在这些正常的代码中间加入几段特意编写的恶意代码,网页就成了具有破坏力的恶意网页了。现在商用的反病毒软件采用的都是“特征码”检测技术,但它只能检测已知的恶意代码。采用机器学习的方法,利用已知恶意代码和正常代码,对未知代码是否是恶意代码进行检测,不仅可以检测出已知的恶意代码,而且也能很好的检测出未知的恶意代码。本文采用机器学习中的BP算法和决策树算法来训练分类器,分类器的性能与样本特征的表征能力有很大关系,我们通过恶意代码与正常代码的比较,总结出了14个典型的特征,用这14个特征和样本标签作为输入来训练分类器。本系统使用网络爬虫抓取网页,利用数据获取模块收集和标记样本(Javascript代码段),并提取特征;用提取的特征作为输入,通过分类器训练与验证模块训练和测试分类器。通过上述的研究和实践,证明了基于机器学习的恶意代码检测技术的高效性和准确性,同时也验证了我们定义的14个特征具有的代表性和影响力,进而为网页恶意性检测提供技术支持。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景
  • 1.1.1 互联网安全概况
  • 1.1.2 恶意代码的定义
  • 1.1.3 恶意代码的传播
  • 1.2 恶意代码分类
  • 1.3 本文主要研究工作
  • 1.4 本文组织结构
  • 2 网页恶意代码
  • 2.1 Web概述
  • 2.2 网页脚本语言
  • 2.2.1 JavaScript语言
  • 2.2.2 VBScript语言
  • 2.3 网页脚本语言的安全
  • 2.3.1 ActiveX
  • 2.3.2 Windows脚本宿主
  • 2.4 网页恶意代码
  • 2.4.1 网页恶意代码分类
  • 2.4.2 网页恶意代码攻击原理
  • 2.5 恶意代码检测技术
  • 2.5.1 基于签名的特征码检测
  • 2.5.2 启发式检测
  • 2.5.3 行为式检测
  • 2.5.4 完整性检测
  • 2.5.5 虚拟机检测
  • 2.6 本章小结
  • 3 机器学习
  • 3.1 机器学习概念和模型
  • 3.1.1 机器学习概念
  • 3.1.2 机器学习模型
  • 3.2 机器学习常用方法
  • 3.3 分类算法
  • 3.3.1 神经网络分类算法
  • 3.3.2 决策树分类算法
  • 3.4 本章小结
  • 4 基于学习的恶意网页智能检测系统
  • 4.1 设计目标与框架
  • 4.2 数据获取
  • 4.2.1 网页抓取工具
  • 4.2.2 样本获取
  • 4.3 样本特征选择与提取
  • 4.3.1 文本的表示
  • 4.3.2 样本特征选择
  • 4.3.3 样本特征提取
  • 4.4 分类器设计
  • 4.5 本章小结
  • 5 实验与结果
  • 5.1 实验目的
  • 5.2 实验数据
  • 5.3 分类器性能指标
  • 5.4 实验环节
  • 5.4.1 OpenCV简介
  • 5.4.2 实验方法
  • 5.4.3 神经网络分类器参数确定
  • 5.4.4 决策树分类器参数确定
  • 5.5 实验结果
  • 5.5.1 测试集上分类器性能验证
  • 5.5.2 训练集上分类器性能验证
  • 5.5.3 分类器与杀毒软件对比
  • 5.6 本章小结
  • 6 总结
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].基于文档分层表示的恶意网页快速检测方法[J]. 计算机系统应用 2019(12)
    • [2].恶意网页识别研究综述[J]. 计算机学报 2016(03)
    • [3].基于自动解混淆的恶意网页检测方法[J]. 信息网络安全 2019(04)
    • [4].删除恶意网页对系统修改的几个方法[J]. 计算机与网络 2014(08)
    • [5].基于两层分类器的恶意网页快速检测系统研究[J]. 网络与信息安全学报 2017(08)
    • [6].给IE浏览器加个参数 不怕IE主页被修改[J]. 网络与信息 2008(11)
    • [7].网页内容链接层次语义树的恶意网页检测方法[J]. 计算机工程与应用 2020(11)
    • [8].为IE浏览器穿件“防弹衣”[J]. 少年电脑世界 2009(Z1)
    • [9].基于恶意网页检测的蜜罐系统的改进[J]. 计算机安全 2009(01)
    • [10].基于Stacking的恶意网页集成检测方法[J]. 计算机应用 2019(04)
    • [11].上网遇到恶意网页时的现象及处理办法[J]. 计算机与网络 2010(13)
    • [12].一种基于Google的恶意网页防御技术[J]. 网络安全技术与应用 2010(04)
    • [13].上网遇到恶意网页时的现象及处理办法[J]. 计算机与网络 2011(23)
    • [14].为IE浏览器找个“贴身卫士”[J]. 网友世界 2011(24)
    • [15].基于自组织映射的恶意网页检测方法研究[J]. 软件导刊 2012(07)
    • [16].网马随处“跑” 手动如何“逃”[J]. 电脑爱好者 2009(12)
    • [17].给IE浏览器加个参数 不怕IE主页被修改[J]. 计算机与网络 2009(13)
    • [18].基于JavaScript的轻量级恶意网页异常检测方法[J]. 华中科技大学学报(自然科学版) 2014(11)
    • [19].网上投诉 在线天天315[J]. 电脑迷 2009(09)
    • [20].DNS中毒攻击再现[J]. 微电脑世界 2013(06)
    • [21].基于机器学习的校园网恶意网页检测方法[J]. 信息与电脑(理论版) 2016(11)
    • [22].自动打造更加安全的网络浏览环境[J]. 电脑爱好者(普及版) 2010(12)
    • [23].病毒播报[J]. 电脑爱好者 2013(21)
    • [24].诺顿病毒播报[J]. 电脑爱好者 2009(15)
    • [25].威胁[J]. 保密科学技术 2015(06)
    • [26].数据挖掘在恶意网页动态检测中的应用研究[J]. 计算机应用与软件 2013(05)
    • [27].基于隐马尔可夫模型的恶意网页检测方法[J]. 软件导刊 2012(05)
    • [28].基于客户端的恶意网页收集系统[J]. 计算机工程 2010(23)
    • [29].防御流氓软件和恶意网站对系统修改的方法[J]. 计算机与网络 2014(14)
    • [30].我国恶意网站现状及防治对策研究[J]. 中国人民公安大学学报(自然科学版) 2008(03)

    标签:;  ;  ;  ;  

    基于学习的恶意网页智能检测系统
    下载Doc文档

    猜你喜欢