基于组合及统计的图像型垃圾邮件检测研究

基于组合及统计的图像型垃圾邮件检测研究

论文摘要

随着物联网时代逐步到来,电子邮件仍然是最重要的沟通工具之一。然而,其副产物——垃圾邮件的出现给人们的生活带来了潜在的危险。其中图像型垃圾邮件促使着反垃圾邮件技术进入一个新的研究领域。如何精确和高效地检测图像型垃圾邮件是急需解决的问题。论文系统地分析了图像型垃圾邮件的产生背景、发展现状及研究意义,提出了基于组合及统计分类器的图像型垃圾邮件的检测方法。论文的主要工作和贡献在于:(1)提出了利用SURF特征提取算法来提取图片的局部不变特征并使用统计学中的高斯混合模型来对图像的这种特征进行高斯混合分布的拟合。通过改进K-means均值聚类算法,以交叉熵作为高斯混合分布之间的距离计算标准,对数据集中图像的高斯混合模型进行聚类以减少实验的计算量,提高实验的效率。最终设计并实现了基于交叉熵的高斯混合模型分类器,通过实验验证,新提出的分类器具有较好的分类效果。(2)以往的图像型垃圾邮件过滤系统只针对图像的内容特征或者图像的文字特征,而容易丢失图像信息,导致分类的准确度不高。论文提出使用堆栈组合模型分类器结合了图像的文字特征与图像的内容特征,充分利用了图像所携带的数据信息,特别地,针对不同的图像特征使用不同的分类器进行分类,然后通过多层次组合得出一个综合的结果。通过多种实验验证,发现使用堆栈组合模型综合图像的文字及内容特征能够获得更高的分类精确度及召回率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究目的与意义
  • 1.3 研究内容与结构
  • 第二章 图像型垃圾邮件检测技术综述
  • 2.1 引言
  • 2.2 垃圾图像
  • 2.2.1 垃圾图像的构造
  • 2.2.2 垃圾图像的特点
  • 2.3 图像型垃圾邮件检测方法
  • 2.3.1 基于文本特征的检测方法
  • 2.3.2 基于边缘特征的检测方法
  • 2.3.3 基于造假特征的检测方法
  • 2.3.4 其它检测方法
  • 2.4 评价指标
  • 2.5 本章小结
  • 第三章 基于统计分类器的图像型垃圾邮件检测
  • 3.1 引言
  • 3.2 图像型垃圾邮件的相似性检测
  • 3.3 高斯混合模型分类器的提出
  • 3.4 特征提取与优化
  • 3.4.1 尺度旋转不变特征算法
  • 3.4.2 SURF特征提取算法
  • 3.4.3 特征向量的优化
  • 3.5 GMM分类器的设计
  • 3.5.1 GMM简介
  • 3.5.2 GMM分类器的设计
  • 3.6 实验与讨论
  • 3.6.1 图像样本库的构建
  • 3.6.2 实验与结果分析
  • 3.7 本章小结
  • 第四章 基于组合的图像型垃圾邮件检测
  • 4.1 引言
  • 4.2 传统的图像型垃圾邮件检测算法
  • 4.3 堆栈组合分类模型的设计
  • 4.3.1 堆栈组合分类模型的提出
  • 4.3.2 堆栈组合分类模型的总设计思路
  • 4.3.3 图像特征的提取
  • 4.3.4 投票与堆栈方法
  • 4.4 实验与讨论
  • 4.4.1 实验数据集
  • 4.4.2 实验与结果分析
  • 4.5 本章小结
  • 第五章 总结与展望
  • 5.1 论文完成的工作
  • 5.2 未来的研究方向
  • 致谢
  • 攻读硕士学位期间发表的论文
  • 攻读硕士学位期间获得的专利申请
  • 缩略词
  • 图表清单
  • 参考文献
  • 相关论文文献

    • [1].河南2017年出境邮件平均每天9万件[J]. 广东交通 2018(01)
    • [2].疑难邮件七步查询投递法的应用与实践[J]. 邮政研究 2020(01)
    • [3].复工邮件要这样写,才能稳住订单和客户[J]. 进出口经理人 2020(03)
    • [4].垃圾邮件会在2020年消失吗[J]. 计算机与网络 2020(04)
    • [5].政务邮件系统安全第三方评价方法研究[J]. 保密科学技术 2020(01)
    • [6].基于R语言的支持向量机在信息安全与垃圾邮件识别中的应用[J]. 机电工程技术 2016(12)
    • [7].卡巴斯基发布 第三季度垃圾邮件和钓鱼攻击报告[J]. 计算机与网络 2015(24)
    • [8].速递邮件全环节信息化分拣路径及改革措施[J]. 内蒙古科技与经济 2016(03)
    • [9].图像型垃圾邮件检测技术的研究[J]. 电脑编程技巧与维护 2015(17)
    • [10].一枚福建罗山空军的专属“免费军事邮件”戳记[J]. 集邮博览 2019(12)
    • [11].火箭邮件的兴衰[J]. 上海集邮 2020(08)
    • [12].“无预告信息”退回邮件是怎么回事?[J]. 集邮博览 2020(09)
    • [13].邮件[J]. 初中生学习指导 2019(07)
    • [14].火眼金睛 认准垃圾邮件[J]. 电脑爱好者 2009(02)
    • [15].给我6秒,我能收回不该发出的邮件[J]. 电脑爱好者 2009(09)
    • [16].你有新邮件 电脑大声告诉你[J]. 电脑爱好者(普及版) 2009(05)
    • [17].为重要邮件写备注[J]. 电脑迷 2010(02)
    • [18].看过我的邮件后还想骗我 没门儿[J]. 电脑迷 2010(06)
    • [19].职场新鲜人邮件礼仪宝典[J]. 电脑爱好者 2010(10)
    • [20].撤回邮件时间更足[J]. 电脑迷 2010(18)
    • [21].3招清扫信箱 远离垃圾邮件[J]. 电脑爱好者 2010(16)
    • [22].清除多余未读邮件[J]. 电脑迷 2010(24)
    • [23].再简单一点点 邮件也能写日记[J]. 电脑迷 2011(10)
    • [24].制定规则 实现邮件管理自动化[J]. 电脑爱好者 2011(17)
    • [25].已发送邮件 自动保存没商量[J]. 电脑爱好者 2011(19)
    • [26].利用邮件组实现群体发送[J]. 电脑迷 2011(24)
    • [27].阅否 简易的邮件追踪服务[J]. 电脑迷 2012(20)
    • [28].跟踪监控你的邮件[J]. 电脑迷 2014(04)
    • [29].变废为宝 向垃圾邮件学习[J]. 电脑爱好者 2013(22)
    • [30].与垃圾邮件亲密接触[J]. 现代计算机(普及版) 2008(08)

    标签:;  ;  ;  ;  ;  

    基于组合及统计的图像型垃圾邮件检测研究
    下载Doc文档

    猜你喜欢