论文摘要
在当今社会,图像文件增长速度惊人,如何对这些文件进行有效的分类和管理成为越来越受关注的问题,这一问题的应用背景也很广,包括阻止某些不健康的图片传输,对大量图片的自动分类管理等等。我们的目的就是实现海量图片的自动分类。因为要做海量处理,所以图像大小对于图像处理的效率至关重要,有鉴于此,我们对图像进行了分割预处理,其中提出的兴趣块概念是通过预处理来缩小图像的关键,然后对图像进行分割处理来得到多个相连的块,我们认为这些块中的每一个是单个物体的几率很大,所以之后对各个块进行分类识别出具体的物体:首先提取出每块的特征值,把这些特征值投影到特征空间中去,然后运用经过改造的超曲面方法来训练和识别出各个单个物体,这是识别单个物体的关键。因为开始的时候所提取的特征值比较多,其中难免有些特征值对于块属于哪个类别关系不大或者这些特征值与其他特征值相关,可以用其他特征值来代替,基于减少计算量方面的考虑,我们采用了数据挖掘方法来删除这部分特征值。针对传统识别方法存在的用于图像检测的颜色,纹理等低级特征值与人类所能理解和识别的高级概念间有很大差距的情况,我们使用了多层次图像识别框架,在已经识别出图像中各单个物体的基础上,对整幅图像进行分类。实验中我们运用了目前在图像处理方面比较流行的Corel图像库以及近来用得比较多的LableMe数据库,实验表明我们的方法在训练样本量不大的情况下,识别的正确率比较高,而且在对海量图像数据进行分类识别方面有比较高的效率。