基于随机投影的场景文本图像聚类方法研究

基于随机投影的场景文本图像聚类方法研究

论文摘要

自然场景图像中的文本字符是描述和认知场景内容的关键线索,对场景视觉信息的表达和理解具有重要价值。由于场景图像中的文本字符存在于复杂的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等,使用传统分割识别方法具有一定的局限性。本文对场景图像背景分离与字符识别的技术难点问题开展了深入的研究。鉴于文本区域的特殊性,颜色、纹理等全局特征的描述能力较弱,提出了使用SIFT和Affine-SIFT两种局部特征描述方式对图像进行特征抽取。由于使用以上两种方法得到的特征点数量太多,对后期处理的效率有很大影响,本文在SIFT算法中使用主方向与辅方向结合的特征挑选方法对特征点进行筛选,对Affine-SIFT算法采用图像自匹配的方法进行有效特征提取。由于图像不同,使得检测到的特征点数量也不同,无法直接通过特征点集评价图像间的相似程度,本文提出了一种基于随机投影的特征映射方法。该方法将图像的局部描述特征点作为输入,得到单个图像的特征矢量,保证了图像间相似性度量的可行性,与特征点匹配的方法相比,该方法效率更快。本文根据不同的数据集使用K-means和Affine propagation两种方法对图像进行聚类,并进行了对比实验。实验结果表明,本文方法可以对包含文字的自然场景图像有效地进行聚类,准确率能达到86.66%。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景及研究的目的和意义
  • 1.2 课题相关领域研究现状及分析
  • 1.3 本文的研究内容及结构安排
  • 第2章 局部特征描述及随机投影理论
  • 2.1 引言
  • 2.2 本文采用的局部特征描述方法
  • 2.2.1 SIFT 方法介绍
  • 2.2.2 ASIFT (Affine-SIFT)
  • 2.3 随机投影理论基础
  • 2.3.1 随机森林可行性证明
  • 2.3.2 随机投影森林工作机制及其优越性
  • 2.3.3 随机投影算法应用到场景文本图像聚类的优势及应用
  • 2.4 本章小节
  • 第3章 基于随机投影的图像聚类算法
  • 3.1 引言
  • 3.2 基于随机投影的图像聚类算法流程及实现
  • 3.2.1 学习随机投影森林
  • 3.2.2 获取图像的特征向量
  • 3.2.3 场景文本图像的聚类分析
  • 3.3 本章小结
  • 第4章 实验结果及分析
  • 4.1 引言
  • 4.2 实验参数说明
  • 4.3 实验对比
  • 4.4 聚类结果图示
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].L_(3/2)正则化图非负矩阵分解算法[J]. 吉林大学学报(理学版) 2014(05)
    • [2].图像搜索结果的滑动窗口多标记传播聚类[J]. 中国图象图形学报 2012(09)
    • [3].基于互信息与类距离测度最优的图像聚类[J]. 计算机工程与应用 2011(34)
    • [4].基于流形正则化判别的因子分解[J]. 山东大学学报(理学版) 2013(05)
    • [5].基于聚类与均匀分布的图像显著性检测算法研究[J]. 微型机与应用 2013(03)
    • [6].基于预处理的超图非负矩阵分解算法[J]. 计算机科学 2020(07)
    • [7].图像特征聚类优先级判定方法[J]. 河南工程学院学报(自然科学版) 2015(01)
    • [8].基于分块加权颜色直方图的图像聚类算法研究[J]. 南京师范大学学报(工程技术版) 2013(01)
    • [9].基于进化规划算法的图像聚类研究[J]. 天津师范大学学报(自然科学版) 2013(04)
    • [10].基于随机投影的场景文本图像聚类方法研究[J]. 计算机应用研究 2011(12)
    • [11].递增EM算法的图像聚类[J]. 西北师范大学学报(自然科学版) 2011(03)
    • [12].空间局部重合图像的快速聚类[J]. 河南教育学院学报(自然科学版) 2015(02)
    • [13].一种图像空间下的ICM聚类方法[J]. 电路与系统学报 2013(02)
    • [14].图像搜索结果的重叠层次聚类与代表点展现[J]. 计算机应用 2012(04)
    • [15].针对东方人黑色虹膜识别的光谱选择[J]. 中国科学:信息科学 2012(07)
    • [16].基于感兴趣区域和FCM的图像检索算法[J]. 福建电脑 2011(04)
    • [17].动态多目标优化的运动物体图像分割[J]. 光学精密工程 2015(07)
    • [18].几何结构保持非负矩阵分解的数据表达方法[J]. 信息与控制 2017(01)
    • [19].基于图像复杂度和贝叶斯的图像自动标注[J]. 计算机工程与设计 2014(06)
    • [20].基于视觉和语义融合特征的阶段式图像聚类[J]. 浙江大学学报(工学版) 2008(12)
    • [21].面向对象的竞争合作学习遥感影像聚类算法[J]. 计算机工程与应用 2016(21)
    • [22].结合FCMS与变分水平集的图像分割模型[J]. 自动化学报 2014(06)
    • [23].AP算法在图像聚类中的应用研究[J]. 计算机与数字工程 2012(10)
    • [24].改进FCM的图像聚类方法[J]. 计算机系统应用 2011(07)
    • [25].基于变分水平集的图像模糊聚类分割[J]. 软件学报 2014(07)
    • [26].基于模糊及分块主纹理谱的图像聚类[J]. 福州大学学报(自然科学版) 2012(05)
    • [27].基于空间邻域加权的模糊C-均值聚类及其应用研究[J]. 计算机应用研究 2010(10)
    • [28].基于空间直方图的免疫图像聚类算法研究[J]. 计算机工程与设计 2008(11)
    • [29].基于深度特征表示的Softmax聚类算法[J]. 南京大学学报(自然科学) 2020(04)
    • [30].联合成对学习和图像聚类的无监督肺癌亚型识别[J]. 计算机科学 2020(10)

    标签:;  ;  ;  ;  

    基于随机投影的场景文本图像聚类方法研究
    下载Doc文档

    猜你喜欢