论文摘要
随着计算机科学技术的迅速发展,现代隐写技术已被广泛的应用于许多领域。但由于其使用方便、成本低廉等原因,也不可避免地存在被恶意使用的情况。隐写检测技术作为其对立面,通过判别载体是否包含隐密信息,从而起到阻止恶意通信的目的。通用隐写检测是一个模式识别的过程,传统通用隐写检测使用单一特征进行检测,检测效果具有一定瓶颈。目前已有学者通过特征融合的方法来融合同一样本的多个基础特征,以期得到更好的检测效果。但是,当前的多特征融合通用隐写检测方法还存在着一些不足,比如如何选择基础特征用于融合,具有一定盲目性;如何更加充分地利用各个基础特征所携带的信息,以期获得更好的多特征融合隐写检测效果;面对海量数据的应用情形,如何让其能够处理大规模数据等。本文针对常用的JPEG格式图像文件,进行特征级融合和决策级融合两个层次上的多特征融合通用隐写检测方法研究,具体工作包括如下三点:1、针对通用隐写检测中基础特征选择的盲目性问题,本文借鉴了哈夫曼树的思想,采用典型相关分析理论中的相关度作为启发因子,提出了一种树型结构的图像隐写多特征融合盲检测中较优特征组合的选取方法,并将该方法应用于隐写检测之中。实验表明,在JPEG图像多特征融合通用隐写检测中,该方法能够在有限的计算复杂度下得到一个融合效果较优的特征组合,通过串行融合该特征组合中的基础特征,能够获得较好的检测效果。2、在给定多个特征集的情形下,本文基于AdaBoostSVM算法的思想,提出了一种改进的可用于通用隐写检测的多特征融合方法。该方法比原始AdaBoostSVM算法更加充分地利用了中间过程中生成的多个弱分类器的信息,并改进了中间过程中的样本权重更新规则。通过实验对比,表明该算法在多种隐写算法的不同嵌入率下,检测效果相较于单一基础特征、串行融合方法和原始AdaBoostSVM算法都有一定的提高。同时,本文还通过实验研究了该算法中的多个参数对检测效果的影响。3、针对海量数据的应用背景,提出了一种基于AdaBoostSVM思想的可并行化的多特征融合隐写检测算法,同时给出了一种在MapReduce框架下的具体实现方法。该算法能够将原始训练集进行划分,并在多处理器上并行执行,最终汇总得到检测结果。通过设计对比实验,以及在多机组成的Hadoop集群上实现该算法并进行并行性能测试,表明该算法在检测率不明显降低的前提下,能够获得良好的并行性能,适合用于海量数据的应用情形。最后,本文还对上述三种融合检测方法进行了比较,并给出了各自适用的应用情形。