视频文字识别的研究

视频文字识别的研究

论文摘要

视频中的文字通常含有很重要的信息,比如地点、时间、人名、主题等。视频文字作为一种高级语义信息,对视频内容的理解、索引具有重要作用。本文研究的是视频文字的提取和识别,主要包括视频文字定位、跟踪和分割三部分算法及关键技术的研究。在视频文字定位方面,本文在定位和验证的两级框架下,提出了一种新的视频文字定位算法。在文本定位模块中,充分利用字符的笔画属性,引入对字符区域有很强响应的笔画算子;经笔画提取,密度过滤,区域分解得到候选文本行。在验证模块中,提取对文字有较强鉴别能力的边缘方向直方图特征,使用Adaboost算法训练的分类器对候选文本行进行筛选。在视频文字跟踪方面,考虑到视频中的文本多为静止或匀速直线运动的刚性文本,本文提出了一种基于块匹配和运动估计的跟踪算法。为了提高跟踪速度,设计自适应三级跟踪器。针对刚体运动文字,采用了线性预测、文字区域图像比较及边缘位图比较相结合的方法,使跟踪速度达到了实时性,跟踪精度达到了像素间精确对齐。现有视频文字分割算法一般只利用了视频文字某一方面的特性。本文研究出的综合利用视频文字时空、笔画、颜色及几何特征的分割算法,可以快速准确地从复杂背景的视频图像中分割出文字。本算法先利用多帧融合进行图像增强;然后基于笔画宽度特征,利用笔画特征算子提取文字笔画;再根据笔画图像标注的文字区域建立颜色模型,提取文字颜色层;最后用改进的连通域分析法去除文字颜色层中的同色背景和噪声。最后,在算法研究的基础上,本文实现了一个Video OCR的实时演示系统,可以自动为视频文件建立文本--帧号索引。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 课题来源与目的
  • 1.3 国内外动态
  • 1.3.1 文本帧检测
  • 1.3.2 文本定位
  • 1.3.3 文本跟踪
  • 1.3.4 分割和增强
  • 1.3.5 文字识别
  • 1.4 本文的工作与组织
  • 第二章 视频文字定位
  • 2.1 引言
  • 2.2 基于笔画提取的文本行初定位
  • 2.2.1 笔画提取
  • 2.2.2 获取文字候选区域
  • 2.2.3 文本行区域分解
  • 2.3 基于边缘方向直方图特征的文本行验证
  • 2.3.1 矩形的边缘方向直方图特征(EOH)
  • 2.3.2 特征提取
  • 2.3.3 特征选择
  • 2.3.4 级联的AdaBoost分类器
  • 2.3.5 分类器识别结果对文本候选区域的验证
  • 2.4 实验结果及分析
  • 2.4.1 算法准确性的评估
  • 2.4.2 算法速度的评估
  • 2.4.3 算法间的比较与定位结果示例
  • 2.5 总结
  • 第三章 视频文字跟踪
  • 3.1 引言
  • 3.2 跟踪方案
  • 3.3 算法的主要数据结构及流程
  • 3.4 试验结果
  • 3.5 跟踪后处理
  • 第四章 视频文字分割
  • 4.1 引言
  • 4.2 算法描述
  • 4.2.1 多帧图像的融合增强
  • 4.2.2 文字区域的笔画特征
  • 4.2.3 文字区域的颜色特征
  • 4.2.4 改进的连通体分析
  • 4.2.5 单字切分
  • 4.3 实验结果及分析
  • 4.3.1 实验数据
  • 4.3.2 实验方法及实验结果
  • 4.4 总结与展望
  • 第五章 汉王视频文字识别系统
  • 5.1 系统总体目标
  • 5.2 系统框架
  • 5.3 系统设计
  • 第六章 总结与展望
  • 6.1 全文总结
  • 6.2 工作展望
  • 参考文献
  • 作者简历
  • 致谢
  • 相关论文文献

    • [1].基于深度学习的任意形状场景文字识别[J]. 四川大学学报(自然科学版) 2020(02)
    • [2].场景文字识别算法的研究[J]. 福建电脑 2020(04)
    • [3].场景文字识别技术研究综述[J]. 计算机工程与应用 2020(18)
    • [4].新华智云推出25款媒体机器人,解决媒体人痛点[J]. 传媒 2019(17)
    • [5].文字识别技术研究[J]. 物联网技术 2018(08)
    • [6].基于注意力矫正的自然场景文字识别[J]. 中国公共安全 2017(09)
    • [7].基于注意力增强网络的场景文字识别[J]. 现代计算机 2020(09)
    • [8].课程学习方法中文字识别算法研究[J]. 福建电脑 2020(04)
    • [9].基于蚁群算法的文字识别[J]. 信息与电脑(理论版) 2019(22)
    • [10].图像文字识别中的预处理技术研究综述[J]. 信息通信 2017(09)
    • [11].计算机文字识别的发展及应用[J]. 科技信息 2008(31)
    • [12].水书文字识别系统研究与实现[J]. 中国新通信 2020(19)
    • [13].简析古文字识别研究的几个认识误区[J]. 语言研究 2019(04)
    • [14].一种序列文字识别方法[J]. 工业控制计算机 2018(05)
    • [15].西波手写文字识别的元学习方法[J]. 云南民族大学学报(自然科学版) 2020(06)
    • [16].基于深度学习文字识别技术发展现状及展望[J]. 电脑知识与技术 2019(18)
    • [17].基于神经网络与比例法的多文字识别[J]. 电视技术 2016(09)
    • [18].基于图像处理的藏文文字识别技术研究[J]. 电脑知识与技术 2019(27)
    • [19].基于机器学习的文字识别方法[J]. 电子世界 2018(02)
    • [20].蒙古文字识别之分类器的设计[J]. 教育教学论坛 2012(20)
    • [21].Office Lens:零成本扫描及文字识别的强大利器[J]. 电脑迷 2015(07)
    • [22].基于正则表达式的文字识别算法在管制航线文件处理中的应用研究[J]. 民航管理 2016(12)
    • [23].改进水印图片里文字识别效果的新方法[J]. 信息化纵横 2009(11)
    • [24].沉毅笃行 锐意进取——清华大学刘长松副教授及其文字识别研究[J]. 中国高校科技与产业化 2009(07)
    • [25].扫描仪使用OCR技巧[J]. 中国现代教育装备 2008(10)
    • [26].基于视频文字识别的跑步成绩自动测量系统研究[J]. 科技与创新 2018(22)
    • [27].街景地图中基于文字识别的自动标注研究[J]. 科技风 2019(26)
    • [28].基于改进TextBoxes++的多方向场景文字识别算法的研究[J]. 现代计算机(专业版) 2018(36)
    • [29].最好的OCR文字识别软件:ABBYY FineReader[J]. 中国信息技术教育 2014(15)
    • [30].改进的BP算法在文字识别中的应用[J]. 信息与电脑(理论版) 2013(12)

    标签:;  ;  ;  ;  ;  ;  

    视频文字识别的研究
    下载Doc文档

    猜你喜欢