论文摘要
随着互联网的飞速发展,它的影响已经渗透到社会生活的各个领域,它改变了我们的生活方式,极大地促进了现代社会的信息交流。但互联网在带给我们方便的同时,也为有害信息的广泛传播提供了便捷。这些有害信息(例如敏感图像)对社会,尤其是对未成年人的影响日益引起人们的极大关注。目前针对网络有害信息的过滤系统,往往采用封锁网址和过滤文字信息的手段,但这是远远不够的,因此基于内容的图像识别与过滤方法越来越引起人们的重视。本文对基于内容的图像识别技术进行了研究,针对敏感图像识别,提出了基于Adaboost(Adaptive boost)算法的特征选择方法,并且利用Adaboost分类器对敏感图像进行识别。本文首先通过对图像识别中的光照补偿问题的研究,对现有的Gamma矫正方法进行了分析,并在计算复杂度不变的情况下,对原来的非线性函数进行了改进,构造了更合理的Gamma矫正曲线,使Gamma矫正方法的性能得到提高;针对彩色图像中的光照补偿问题,比较了基于不同彩色模型的处理方法;实验结果表明,本文方法在弱化光照影响、提高图像质量方面具有良好的性能。然后介绍了去除图像椒盐噪声的传统方法,并利用线性预测去除图像椒盐噪声。根据椒盐噪声的特点,判断图像像素是信号像素还是可能的噪声像素,把图像信号像素作为已知信息,把噪声像素作为未知信息,采用三阶线性预测器,利用信号像素预测出噪声像素。实验结果表明,该算法的运算量小,去噪能力强,尤其在处理噪声高度污染图像时,去噪能力表现更为突出。针对敏感图像识别,介绍并研究皮肤掩码图像的提取方法:根据肤色在颜色空间的分布对皮肤进行提取,然后在得到的肤色掩码图像的肤色区域进行纹理分析,这样得到的掩码图像经过肤色连通区域处理可以进一步去除噪声。对掩码图提取和选择用于区分敏感图像和非敏感图像的特征,将提取的特征输入到Adaboost分类器。对于分类器,分为学习阶段和测试阶段。在学习阶段,从人为分类的敏感图像库和非敏感图像库提取特征输入到Adaboost分类器,进行训练得到Adaboost分类器。本文对利用模拟退火算法的训练方法进行了研究。在测试阶段,从待测图像提取特征输入到学习好的Adaboost分类器中,根据分类结果判断其是否为敏感图像。试验结果表明:针对敏感图像识别提出的基于Adaboost算法的特征选择方法能有效地选择敏感图像特征,并且利用Adaboost分类器能有效地识别敏感图像和非敏感图像。