面向目标检测识别应用的算法加速器体系结构研究

面向目标检测识别应用的算法加速器体系结构研究

论文摘要

无论在军事还是民用领域,目标检测识别技术都具有重要的研究意义和应用价值。人们提出了很多方法来提高目标检测识别的准确性,且取得了显著的成果,但是在提高目标检测识别处理速度方面的相关研究较少。事实上,在将目标检测识别技术应用于实际系统中时,除了保证足够高的识别准确率,识别速度能否满足系统对实时性的要求也是一个关键问题。另外,目标检测识别系统的体积、实现代价、功耗以及对不同应用环境的适应能力也是需要研究的问题。基于FPGA(FieldProgrammableGateArray)的硬件加速技术能够实现较大程度的算法到计算引擎的空间映射(区别于通用处理器),且具备计算和存储资源的定制能力(区别于ASIC(ApplicationSpecificIntegratedCircuits)),因此在灵活性和高性能方面做到了比较好的权衡。同时,FPGA硬件加速器与通用处理器相比还具有体积小、功耗低的优势。基于FPGA的硬件加速技术对于提高目标检测识别技术的实用性具有重要意义。本文研究面向目标检测识别应用的算法加速器体系结构,主要研究四类应用:静态刚性目标识别、运动目标检测提取、行人检测识别、人脸检测识别,研究目的是实现算法到有限硬件资源的充分高效的映射,在硬件实现代价、处理速度和处理效果之间进行适当的折中。基于研究成果为这四类应用分别设计了基于FPGA的硬件加速原型系统。同时,针对行人、人脸检测识别等一类具有不规则数据访问模式的图像处理应用提出了一种通用无冲突并行访问存储模型。首先研究了基于Hausdorff距离与模板匹配的静态刚性目标识别硬件加速技术。静态刚性目标识别应用的数据访问模式较规整,但是计算复杂性较大。本文提出了面向大尺寸窗口遍历型应用的并行计算模型,目的是实现运算单元的数据消耗速度与存储系统的数据供应速度之间的均衡。将基于多体存储结构的无冲突并行访问存储模型与基于分治并行策略的多PE(Processing Element)计算结构相结合,缓解了只采用前者时所遇到的存储体个数太多的问题以及只采用后者时所面临的存储容量受限的问题。性能分析与实验结果表明采用该计算模型可以显著提高运算单元的并行度。其次,研究了运动目标检测提取算法的硬件加速技术以及存储优化技术。相对于静态目标,在现实场景中,人们往往对运动目标更感兴趣。本文设计了对图像中不同运动目标进行分类的硬件加速结构;针对图像序列中运动目标数量、位置、大小等信息不断变化的特点,引出了“可变数据集合维护问题”,设计了一种通用的高速硬件链表结构,提高了对可变数据集合进行存取访问的灵活性。接下来,对于检测并提取出的运动目标,后续工作通常是运动目标识别。本文选取运动目标识别应用中计算复杂性较大且应用需求较广泛的行人检测识别与人脸检测识别进行重点研究。行人与人脸属于“非刚性目标”,与刚性目标不同,非刚性目标的轮廓是不规则且不断变化的,这不仅增加了计算的复杂性,也导致了对存储器数据访问模式的不规则性。本文研究了基于主动形状模型(ActiveShape Model,ASM)的行人识别硬件加速技术。针对计算复杂性较大所造成的计算资源不足问题,为了实现硬件代价和处理速度的适当平衡,提出了资源共享模式和硬件流水线方式相互结合、灵活配置的计算资源映射策略,基本思想是对于占用较多计算资源的非瓶颈任务,采用资源共享模式,将多个相同类型的操作映射到一个功能部件上分时执行,多个操作的源操作数通过多路选择器进入功能部件的输入端口,通过采用优化的指令调度算法,最大程度的缩短了同一类型的不同操作之间的启动时间间隔;而对于计算复杂性较大的瓶颈任务,分配较多的计算资源,尽可能的采用流水线技术和其它并行策略提高处理速度。本文在FPGA上构建了原型系统,实现了行人的检测、识别与跟踪,实验结果表明,与相关工作相比具有较大的速度优势。对于人脸目标,本文提出了一种精确分类的视角无关人脸检测方法,能够对垂直于图像平面±90度和图像平面内360度范围的所有人脸姿态进行快速准确地检测分类。树形检测器框架结构中的每个检测节点采用一种创新的两段式Boosting方法(Two-Stage Boosting,TS-Boosting)进行训练,核心思想是在判断一个样本是否属于某个姿态区间时,不仅要看该样本属于该姿态区间的概率有多大,还要看该样本不属于其它姿态区间的概率有多大。基于提出的算法,设计了硬件加速器,并提出了一种对硬件资源进行动态配置的设计空间探索算法。实验表明,本文提出的方法和硬件加速器与相关工作相比具有较高的检测准确率和处理速度。本文最后针对行人、人脸检测识别等一类具有不规则数据访问模式的图像处理应用提出了一种通用无冲突并行访问存储模型,在主存储器与处理器之间构建了一种多体存储结构,并将大部分的不规则数据访问模式归类为对图像中多个局部矩形兴趣区域(RegionsofInterest,ROIs)内的任意位置固定大小矩形数据块的无冲突并行访问。理论分析与实验结果表明该存储模型与相关工作相比更适合于多兴趣区域图像处理应用,与直接访问主存储器相比在访存速度上提高了几倍到上百倍。综上所述,本文面向目标检测识别应用,研究了使用硬件加速技术提高性能的关键技术,对算法并行特性分析、体系结构设计、计算和存储资源的灵活配置、面向不规则数据访问模式的并行存取模型等问题提出了有效的解决方案,对于推进目标检测识别技术的研究和实用化具有一定的意义和价值。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 目标检测识别技术概述
  • 1.1.1 基本概念
  • 1.1.2 目标检测识别技术的研究意义和应用价值
  • 1.1.3 目标检测识别技术发展现状
  • 1.1.4 目标检测识别应用所面临的挑战
  • 1.2 基于FPGA的硬件加速技术概述
  • 1.2.1 硬件加速技术基本概念和特征
  • 1.2.2 硬件加速技术的优势
  • 1.2.3 硬件加速技术在科学计算问题中的应用现状
  • 1.2.4 硬件加速的关键技术问题
  • 1.3 本文的主要工作
  • 1.4 全文组织
  • 第二章 静态目标检测识别应用硬件加速关键技术研究
  • 2.1 引言
  • 2.2 基于Hausdorff距离的目标匹配方法
  • 2.2.1 Hausdorff距离
  • 2.2.2 目标匹配方法
  • 2.3 基于Hausdorff距离的目标匹配硬件加速器设计实现
  • 2.3.1 并行性分析
  • 2.3.2 任务划分策略
  • 2.3.3 体系结构设计
  • 2.3.4 距离变换的FPGA实现
  • 2.3.5 平移匹配的FPGA实现
  • 2.4 存储资源对系统可扩展性的影响
  • 2.5 面向大尺寸窗口遍历型应用的并行计算模型
  • 2.6 实验与性能比较
  • 2.7 小结
  • 第三章 运动目标检测提取应用硬件加速与存储优化研究
  • 3.1 引言
  • 3.2 运动目标检测提取应用硬件加速体系结构研究
  • 3.2.1 运动目标检测
  • 3.2.2 基于Flood-Fill算法的运动区域提取
  • 3.2.3 实验与分析
  • 3.3 基于高速硬件链表结构的存储优化
  • 3.3.1 设计难点及解决方案
  • 3.3.2 硬件链表体系结构设计
  • 3.3.3 硬件链表的应用
  • 3.3.4 实验与分析
  • 3.4 小结
  • 第四章 行人检测识别应用硬件加速关键技术研究
  • 4.1 引言
  • 4.2 理论背景与行人检测识别算法描述
  • 4.2.1 主动形状模型ASM
  • 4.2.2 随机模型
  • 4.2.3 Kalman滤波
  • 4.2.4 基于主动形状模型和Kalman滤波的行人检测识别算法
  • 4.3 行人目标检测识别算法并行性研究
  • 4.4 存储层次的并行访问优化
  • 4.5 资源共享与硬件流水线相结合的计算资源映射策略
  • 4.5.1 资源共享
  • 4.5.2 硬件流水线
  • 4.6 基于主动形状模型的行人目标识别硬件加速体系结构研究
  • 4.6.1 总体结构设计
  • 4.6.2 关键模块设计
  • 4.6.3 基于资源共享的线形乘累加器设计
  • 4.6.4 基于资源共享的Kalman滤波器设计
  • 4.7 实验结果与性能分析
  • 4.7.1 测试平台
  • 4.7.2 资源使用情况
  • 4.7.3 与软件实现的处理速度比较
  • 4.8 行人目标识别与跟踪原型系统设计
  • 4.8.1 行人识别跟踪系统相关研究
  • 4.8.2 系统总体框架结构
  • 4.8.3 原型系统实现
  • 4.8.4 实验结果
  • 4.9 小结
  • 第五章 视角无关人脸检测识别算法与硬件加速关键技术研究
  • 5.1 引言
  • 5.2 理论背景
  • 5.2.1 AdaBoost简介
  • 5.2.2 基于AdaBoost的人脸检测框架
  • 5.3 基于两段式Boosting的视角无关人脸检测方法
  • 5.3.1 树形视角无关人脸检测器框架结构
  • 5.3.2 精确分类的两段式Boosting方法TS-Boosting
  • 5.3.3 弱分类器的第一阶段
  • 5.3.4 弱分类器的第二阶段
  • 5.4 基于两段式Boosting的视角无关人脸检测硬件加速体系结构
  • 5.4.1 总体结构
  • 5.4.2 检测节点间的组织与通信
  • 5.4.3 强分类器的并行结构
  • 5.4.4 两段式弱分类器的并行结构
  • 5.5 硬件加速体系结构的动态配置策略
  • 5.5.1 总体结构层次的动态配置
  • 5.5.2 检测器框架结构层次的动态配置
  • 5.5.3 强分类器结构层次的动态配置
  • 5.5.4 弱分类器结构层次的动态配置
  • 5.5.5 系统动态配置的设计空间探索算法
  • 5.6 实验与性能比较
  • 5.6.1 训练样本
  • 5.6.2 训练过程
  • 5.6.3 测试平台与测试数据
  • 5.6.4 资源使用情况
  • 5.6.5 与软件和相关工作的速度比较
  • 5.6.6 与相关工作的准确率比较
  • 5.6.7 动态配置对系统性能的影响
  • 5.7 小结
  • 第六章 面向不规则数据访问模式的无冲突并行访问存储模型
  • 6.1 引言
  • 6.2 面向不规则数据访问模式的无冲突并行访问存储模型及体系结构
  • 6.2.1 总体框架
  • 6.2.2 数据划分策略
  • 6.2.3 虚拟地址计算
  • 6.2.4 基于地址映射表的寻址机制
  • 6.2.5 基于地址映射表的寻址体系结构
  • 6.2.6 接口、地址映射表更新机制及体系结构
  • 6.2.7 编址一致性
  • 6.3 实验结果以及与相关工作的比较
  • 6.3.1 实验结果与性能分析
  • 6.3.2 与相关工作的比较
  • 6.4 小结
  • 第七章 结束语
  • 7.1 论文工作的总结
  • 7.2 课题研究展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 作者在学期间参加的科研工作
  • 相关论文文献

    • [1].光电成像目标检测识别跟踪平台建设探索[J]. 电气电子教学学报 2020(03)
    • [2].高分辨率遥感图像中油库的检测识别[J]. 华中科技大学学报(自然科学版) 2011(S2)
    • [3].铁路人脸检测识别技术应用探讨[J]. 中国铁路 2015(08)
    • [4].新形势下红外成像导引头目标检测识别共性技术分析[J]. 科技与创新 2016(19)
    • [5].基于双通道的快速低空无人机检测识别方法[J]. 光学学报 2019(12)
    • [6].番茄病害检测识别方法的构建与应用[J]. 贵州农业科学 2020(10)
    • [7].高空域噪声影响下的目标检测识别方法研究[J]. 现代防御技术 2008(01)
    • [8].基于颜色属性的信号指示灯检测识别[J]. 现代计算机(专业版) 2018(07)
    • [9].烟草分拣线条烟烟姿检测识别装置的设计与实现[J]. 科技创新导报 2015(06)
    • [10].基于Gabor小波的人脸检测识别方法研究[J]. 无线互联科技 2013(01)
    • [11].输电线路除冰机器人障碍视觉检测识别算法[J]. 仪器仪表学报 2011(11)
    • [12].基于RAM-MS320C6x的高速套牌车检测识别系统设计[J]. 现代电子技术 2016(10)
    • [13].红外成像导引头目标检测识别共性技术综述[J]. 上海航天 2015(01)
    • [14].基于改进SSD模型的交通路标检测识别研究[J]. 信息记录材料 2020(04)
    • [15].基于单片机的智能水下目标检测识别系统设计[J]. 电子制作 2019(01)
    • [16].遥感舰船目标检测识别方法[J]. 遥感信息 2020(01)
    • [17].ARP攻击的检测识别与防范[J]. 网络安全和信息化 2017(03)
    • [18].检测识别跟踪分离的在线多样本视频目标跟踪[J]. 计算机工程 2012(23)
    • [19].无人机基于视觉自主着陆的跑道识别跟踪[J]. 单片机与嵌入式系统应用 2017(06)
    • [20].基于FPGA人脸检测识别平台的构建[J]. 电声技术 2019(02)
    • [21].基于有限元离散的不规则管道几何边界红外瞬态检测识别[J]. 化工学报 2012(12)
    • [22].基于机器视觉深度学习的电站渗水检测识别技术研究[J]. 电子设计工程 2020(20)
    • [23].基于可见光遥感图像的船只目标检测识别方法[J]. 科技导报 2017(20)
    • [24].移动机器人检测识别技术的研究[J]. 电气自动化 2015(06)
    • [25].高压输电线路巡线机器人障碍物视觉检测识别研究[J]. 传感技术学报 2008(12)
    • [26].机器学习在桥梁病害检测识别中的研究应用进展[J]. 公路交通科技(应用技术版) 2019(09)
    • [27].基于负熵的人员脚步震动信号检测识别算法[J]. 小型微型计算机系统 2010(01)
    • [28].基于计算机视觉的手势检测识别技术[J]. 电脑迷 2017(11)
    • [29].基于优化YOLOv3的低空无人机检测识别方法[J]. 激光与光电子学进展 2019(20)
    • [30].基于Hough树林的空间有形目标特征训练与检测识别方法[J]. 红外与激光工程 2011(08)

    标签:;  ;  ;  ;  ;  

    面向目标检测识别应用的算法加速器体系结构研究
    下载Doc文档

    猜你喜欢