论文摘要
目标的运动跟踪分析是计算机视觉研究领域的重要课题之一。目标跟踪的主要目的是对采集到的包含运动目标的视频数据进行分析、处理,利用运动目标的各种特性获得对目标准确的检测、定位与跟踪,为后继的应用处理提供资料和技术支持。它在安全监控、人机交互、医疗诊断等方面有着广泛的应用。本文主要针对背景相对静止条件下,多个运动目标的实时跟踪问题进行研究。本文所做的主要工作包括:1.目标检测:利用摄像机采集运动目标视频图像。回顾了三种传统的检测方法:帧差法、光流法和背景减除法,分析各自的优缺点。重点讨论了一种基于帧水平检测和像素级检测的运动检测算法。该算法认为长时间不动的像素点为背景点,建立背景模型;用背景图像和当前帧图像差分,获得前景图像,用二值化图表示。实验分析了该算法的特性,讨论了该算法中参数的确定方法。2.消除噪声和目标定位:对检测出的二值化前景图进行一系列的开、闭运算操作,以消除噪声和填补前景目标实体上“沟”、“洞”,减少对后续操作的影响。深入研究了两种传统的定位方法:投影法和连通区域分析法。传统的投影法只针对场景中只有一个目标的情形,而连通区域分析法将位置临近的几个目标当作一个目标标识。在此基础上,本文提出了一种针对多人的改进投影定位分析方法,并用实验证明了该算法的有效性。3.目标跟踪:结合前面的改进投影定位分析法,本文利用卡尔曼滤波器进行预测跟踪。首先依据卡尔曼理论设计线性模型,确定卡尔曼滤波器的状态方程和常数矩阵,然后对状态向量初始值和系统初始误差矩阵做了合理的设定,通过迭代和匹配完成跟踪任务。当目标深度遮挡或丢失,改进的投影定位分析法无法定位时,使用卡尔曼滤波器预测目标的位置。实验表明,该方法能达到很好的效果。本文的创新之处在于:对二值化前景图的投影图进行分析,发现人头顶位置的水平坐标对应着垂直投影图中局部波峰的横坐标;而人的高度(头顶位置到脚的垂直距离)对应着垂直投影图中局部波峰的纵坐标。根据这一特性,提出一种改进的投影定位分析法,并在此基础上和卡尔曼滤波预测相结合,可以对场景中多个目标人进行跟踪。我们在实时的多人跟踪实验中,取得了满意的结果,并证明该算法具有如下特点:1.算法允许场景中多个人存在,多个人同时进入场景,当多个目标人位置临近甚至浅度遮挡时,也能有效区分定位目标。2.该算法是通过对二值化前景图的投影进行分析,定位场景中的人。垂直投影图是垂直线上像素个数的积累,因此在背景上的小块噪声,前景目标身上的“小洞”,甚至前景目标分裂成多块也不会影响最后的结果,算法具有很好的抗噪声能力。3.人头项部对应着投影图的局部峰值,因此只要头部没有完全遮挡,即使身体“融合”在一起,本文的算法也能够准确的区分定位他们。4.在由于不好的背景减除导致的目标丢失或是深度遮挡情况导致的目标丢失的情况下,基于Kalman滤波的跟踪方法能较准确的预测目标位置,弥补了背景减除和定位方法的不足,保持了轨迹的连贯,保证了跟踪的稳定。