基于DCT域的视频字符检测算法研究

基于DCT域的视频字符检测算法研究

论文摘要

自动地抽取图像/视频的语义内容在图像/视频检索中具有重要意义。在基于内容的视频检索和浏览中,可供利用的一个重要线索是视频中所包含的字符。因此,自动地检测和识别字符是抽取视频语义内容的基础和关键所在。目前,针对视频图像字符检测和识别在象素域做得比较多,并取得了一些有应用价值的进展。然而,视频由于数据量大,通常以压缩后的视频流形式进行存储和传输。若将视频流完全解码后还原为一幅幅静止图像,再进行字符检测和识别,计算量大,也严重地影响了处理速度。若在压缩域中对视频流直接处理,还原部分信息,然后进行字符检测可以减少完全解码的时间,同时处理数据量也更少,有利于提高实时性。本文结合现有的压缩域视频字符检测技术,提出了一种基于DCT域的视频字符检测算法。它利用压缩视频流中字符纹理所具有的方向性和字符通常都成行/列分布的特点,通过一种新的自适应阈值分割,有效地将字符块与非字符块区分开来,并进一步利用形态学方法进行平滑和滤波并对候选文本区进行验证,最后,通过水平和垂直方向投影,准确地定位字符区域。实验结果表明,该算法在复杂背景下也能取得较高的检测率,具有良好的鲁棒性和实用性。同时,针对已定位好的字符区域,提出了一种融合图像直方图统计信息与边缘特征的二值化方法用于分割字符。该方法先利用梯度算子检测出图像的边缘点,接着选择每个边缘点8邻域内具有最高、最低灰度的点并分别计算这些最高、最低灰度点的均值作为高、低两个阈值,然后统计图像中灰度在这两个阈值之间的所有象素的直方图,最后将这个直方图作为参数利用Otsu方法对图像进行二值化。此二值化方法时间复杂度较低,融合了全局直方图信息与边缘信息,取得了较好的分割效果。

论文目录

  • 摘要
  • ABSTRACT
  • 插图索引
  • 附表索引
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状及发展动态分析
  • 1.3 存在的问题与难点
  • 1.4 本文研究内容
  • 1.5 本文组织结构
  • 第2章 视频字符检测算法综述
  • 2.1 视频中文本的归类
  • 2.2 视频中字符的特征
  • 2.3 视频字符检测算法的分类综述
  • 2.3.1 基于边缘的方法
  • 2.3.2 基于纹理的方法
  • 2.3.3 基于连通域的方法
  • 2.3.4 基于支持向量机的方法
  • 2.3.5 基于压缩域的方法
  • 2.4 小结
  • 第3章 一种DCT域的视频字符检测算法
  • 3.1 JPEG压缩标准
  • 3.2 DCT系数特征的提取
  • 3.3 DCT域视频字符检测处理位置
  • 3.4 DCT域视频字符检测算法框架
  • 3.5 阈值选取
  • 3.5.1 现有的阈值选取方法
  • 3.5.2 本算法阈值选取
  • 3.6 平滑和滤波
  • 3.6.1 平滑线性滤波
  • 3.6.2 统计排序滤波
  • 3.6.3 形态学滤波
  • 3.6.4 本算法平滑滤波过程
  • 3.7 文本区域验证
  • 3.7.1 求取文本区域
  • 3.7.2 文本区域验证方法
  • 3.8 根据水平投影和垂直投影准确定位
  • 3.9 实验结果及对比分析
  • 3.10 小结
  • 第4章 DCT域视频字符检测中的二值化方法研究
  • 4.1 经典二值化方法
  • 4.1.1 全局阈值化方法
  • 4.1.2 局部阈值化方法
  • 4.1.3 边缘检测法
  • 4.1.4 基于区域的方法
  • 4.2 融合直方图与边缘的二值化方法
  • 4.2.1 二值化方法流程
  • 4.2.2 利用梯度算子求取边缘点
  • 4.2.3 利用OTSU方法对图像进行二值化
  • 4.2.4 基于连通成分的后处理
  • 4.3 实验结果分析
  • 4.4 小结
  • 总结与展望
  • 1 总结
  • 2 工作展望
  • 参考文献
  • 附录A 攻读硕士学位期间发表论文及参加科研项目
  • 致谢
  • 相关论文文献

    • [1].华夏万字符万舞全球传播史——万字符传播史(下)[J]. 社会科学论坛 2017(01)
    • [2].基于C语言的字符图案打印研究[J]. 电脑编程技巧与维护 2017(03)
    • [3].华夏万字符是四季北斗合成符——万字符传播史(上)[J]. 社会科学论坛 2016(11)
    • [4].巧用字符来“作画”,轻松打造趣味图案[J]. 电脑知识与技术(经验技巧) 2016(01)
    • [5].使用Google搜索时弹出阻止页面[J]. 电脑迷 2012(14)
    • [6].温暧的字符[J]. 中国校园文学 2008(07)
    • [7].基于背景融合的机载字符生成[J]. 电子技术应用 2015(04)
    • [8].巧妙实现带框字符的替换[J]. 电脑知识与技术(经验技巧) 2013(08)
    • [9].二里头文化陶字符量化分析[J]. 考古与文物 2012(06)
    • [10].复杂背景图象字符特征检取方法的分析研究[J]. 电脑知识与技术 2008(05)
    • [11].夏日好商机——魔幻风扇[J]. 生意通 2008(07)
    • [12].字符验证码识别技术的研究[J]. 安徽电子信息职业技术学院学报 2020(05)
    • [13].字与字符:字的同一性判断及字与字符的关系变化[J]. 语言研究 2019(01)
    • [14].基于字符级循环网络的查询意图识别模型[J]. 计算机工程 2017(03)
    • [15].基于数学形态学的渐变色字符定位算法[J]. 计算机与数字工程 2016(10)
    • [16].网络高清摄像机动态字符叠加器研制[J]. 中小企业管理与科技(下旬刊) 2016(11)
    • [17].巧妙提取特定字符前后的数据[J]. 电脑知识与技术(经验技巧) 2015(05)
    • [18].从“非法字符”到“敏感字符”[J]. 杂文选刊(上旬版) 2011(02)
    • [19].尾行状态:从城市观察到艺术生产[J]. 画刊 2020(08)
    • [20].特别的字符(六首)[J]. 诗林 2019(05)
    • [21].制作字符组成的图片[J]. 电脑迷 2012(04)
    • [22].东巴文字符形态个性化风格探析[J]. 中央民族大学学报(哲学社会科学版) 2012(05)
    • [23].一种简单的基于字符形状的验证码识别技术[J]. 桂林电子科技大学学报 2010(01)
    • [24].基于FPGA的图像字符叠加器设计[J]. 电脑知识与技术 2010(13)
    • [25].云南东川布依族摩公经书文字研究[J]. 贵州民族研究 2019(12)
    • [26].高速公路收费系统字符叠加方案探讨[J]. 中国交通信息化 2016(02)
    • [27].图片字符提取数字化处理浅谈[J]. 通讯世界 2015(01)
    • [28].是人还是机器? 一个验证码的判定[J]. 电脑爱好者 2009(16)
    • [29].140字符的获奖小说[J]. 现代计算机(普及版) 2008(08)
    • [30].监视屏幕字符叠加与显示[J]. 工业控制计算机 2011(10)

    标签:;  ;  ;  ;  ;  

    基于DCT域的视频字符检测算法研究
    下载Doc文档

    猜你喜欢